YangFan.net

January 26, 2007

yangfan.net域名入手

  从去年11月起就盯着yangfan.net的域名了,看着它的状态从RedemptionPeriod变成PendingDelete,掐指算准删除日期,然后上去注册,结果很显然,手动注册的不如专业网站自动抢注,域名被snapnames抢走。跑去一看,这是个卖域名的网站,再仔细一搜,还是个挺知名的卖域名的网站。于是想看看究竟是谁通过它买了这个域名,结果一查,竟然处于拍卖中,敢情它是不管三七二十一先注册下来再开始卖啊,如果没人买,大不了浪费一年注册费,对它们来说,也是没几个钱的事情,无非浪费了域名资源而已。于是就随手出了个底价$60,碰碰运气。
  三天后,就是今天,运气碰成了,$60买下了这个域名(包括第一年注册费用)。它给我选的注册商不提供免费域名解析服务(要$14单独买),于是把nameserver转了,就一切ok。等待60天后把域名转到国内注册商上,整个过程就结束了。
  可见一个人的名字重复率太高是很不好的事情,连个网站域名都难弄,算来我还是幸运的了,把最看重的域名买了下来,千千万万和我重名或者谐音的人或者公司,就弄不到域名了。
  顺手看了一下其他yangfan的域名,除了我拥有的yangfan.netyangfan.name之外:
    yangfan.com    上海扬帆毛衫有限公司
    yangfan.cn    河北辛集市洋帆制衣有限公司
    yangfan.com.cn  金华市扬帆电脑有限公司
    yangfan.net.cn  海南扬帆国际旅行社有限公司
  而通过各大搜索引擎一起使用挖掘出来的蛛丝马迹,yangfan.net原来很可能是属于温州市平阳县扬帆机械厂——是不是倒闭了?
  另外,不知道这些网站的用户会不会互相弄混……
16:29 | Category : Blog | Comments (3)

January 12, 2007

是谁小鸡肚肠?又是谁在流氓?

  首先打开http://blog.sohu.com/robots.txt,看到以下内容:
   User-agent: Googlebot
   Disallow:
   User-agent: baiduspider
   Disallow: /
   User-agent: Nutch
   Disallow:
   User-agent: *
   Disallow: /
  可以看到,搜狐博客禁止了除了Google和Nutch之外一切搜索引擎的抓取,而且还单独把百度拿出来深恶痛绝地鞭尸。这显然是小鸡肚肠的行为,对用户很不负责——因为别人无法通过搜索引擎搜到自己的博客内容。但是且慢,真的如此吗?
  在各个搜索引擎用site:blog.sohu.com进行搜索。
  首先是Google的结果,共有搜索结果417000项,全部是三级域名xxxx.blog.sohu.com这样的首页,任意找一个xxxx.blog.sohu.com去site:一下,可以看到还是都抓到内容的。417000,是一个三级域名的数量,差不多也就是他抓到的搜狐博客的用户数量。
  然后是搜狗的结果,2984875个页面,看到的也都是三级域名,随便找个继续site:,可以看到只有首页没有内容,说明sogou就算是在自己家也还是很道德的。至于为什么sohu博客吃里扒外让Google抓却不让自家的sogou抓,那就要去问张朝阳了。
  接着给出有道的结果:抱歉,没有找到与 "site:blog.sohu.com" 相关的网页。很好,遵纪守法。
  最后隆重推出百度的结果,找到了131000篇,数量不是关键,关键是它的结果从第二篇开始就是内容页面,也许是百度不敢太过分,从外部过来的页面抓了之后看了眼robots.txt,于是不再往下继续,但是好歹,有外链的全给抓了(应该不是全部,否则数量也太少了)。这只有三种可能,一是百度不懂robots.txt的规范,二是百度装作不懂,做了流氓——还好它没全抓,否则就不是流氓而是黑社会了,第三就是只抓外链页面是允许的,我个人感觉这种可能性不大。地震震得w3c网站连不上,所以也确定不了。
  看完sohu的,再来看看流氓百度家的http://hi.baidu.com/robots.txt,内容如下:
   User-agent: Baiduspider
   Disallow:
   User-agent: Googlebot
   Disallow:
   User-agent:
   Disallow: /
  流氓就是流氓,比他强的他不得罪,比他弱的,全部封杀。至于最后那个User-agent为什么不加个*,我就不知道了。这样写是不是符合规范呢?如果不符合,那就是白写,就算页面被人抓了也是白抓。那么来看看site:hi.baidu.com的搜索结果。
  首先还是Google的结果,只有96400个结果,都是每个人的首页!而且搜几个朋友的百度空间,发现只有首页没有内容,也就是说,Google也许只抓了每个人的首页,即使它被允许全抓。
  然后是有道的结果,和Google一样,只有每个人的首页而没有内容,一共171000条。有道还是挺听话的。至于为什么数量几乎是Google的两倍,很简单,因为Google没有抓中文目录,而有道抓了。正好这里顺路鄙视一下百度这么大个家伙居然还允许用户用中文目录名。
  百度自己的结果在这里就没有什么意义了,4980000条,挺多。
  最后是搜狗的结果,667756项。结果很眼熟是吧,没错,就是和百度搜搜狐博客的结果非常像,应该是只抓了外部有链接的,没有继续扒拉。
  好了,结果出来了,搜狐博客和百度空间,毫无疑问,都不是合适的BSP,因为它们连用户内容被检索的自由都不给。相比之下同样是门户的博客,新浪和网易至少没有从robots.txt上去做手脚。
  谁是流氓呢?在能找全robots.txt规范前不下定义,但是比较显然的是,百度流氓的可能性很大,而搜狗的以彼之道还致彼身很可能因为百度自己的写法错误而只能让百度有苦说不出。
21:30 | Category : Blog | Comments (4)

January 10, 2007

iphone!

  apple总是能给人带来惊喜,今年轮到了传说中的iPhone
Tag: ,
22:44 | Category : Blog | Add Comment
Subscribe Atom
  • Subscribe to google
  • Subscribe to bloglines
  • Subscribe to zhuaxia
Search
License
  • Creative Commons Lisence
Copyright © 2011 Yang Fan. Powered by Fomalhaut 1.0b.