YangFan.net

Tag : blog Search in Google

Blog Day的推荐

  每年的8月31日是Blog Day,好比植树节大家一起植树一样,Blog Day大家要做的是一起写Blog,而且是同主题的Blog。今年的主题是推荐5个自己喜欢的Blog。虽然现在已经过了8月31日,但是好歹Better later than never,我就来推荐五个。它们的作者都是身边的朋友,它们的文字都充满了个性。或许这比推荐一些人人访问的博客媒体更有价值吧。
  老姚涂炭:在刚刚结束的一个不知所谓的博客比赛中拿了冠军。当然,这种档次的比赛只能算是老姚丰富生活中的一个添头。这也证明了即使是一个脱离了低级趣味的博客,也会偶尔低级趣味一把。他的阳春白雪的爱好们和他期待被人瞩目的性格十几年来都没有改变,正如这次被他轻松席卷冠军的比赛主题一样:双面
  风吹麦田另一个哇:阿哇同学的两个博客空间。第一个是完完全全的漫画,如果没有记错的话,几百篇Blog里只有一篇出现了文字;而第二个则是个传统意义上的Blog,个人的喜怒哀乐,个人的作品,等等。生活中的Ava和漫画里的Ava还是有很大区别的,所以名字叫做“另一个”。
  汸泣溤野┆像仟:一个很诡异的名字,如作者所说“博客是一种文字游戏,博客题目是则游戏中的游戏”。不过这个博客本身,并不是标题那样地游戏。科班出身的计算机硕士,为了自己的理想而投身媒体,又到香港为自己充电加油。这样的背景这样的经历,她用心写下的文字,一定是值得期待的。
  Purplexsu的旅游日志:一个纯粹记录旅游的空间,即所谓的Travel Log,很羡慕他能去过那么多的地方。当然,除了这个旅游日志之外,薛总还有一个记录生活的Blog,搞技术的人,除了没有Blog的,剩下的总能找到类似的Blog内容。
  沉默之沙:伟大的Magic Jack。因为伟大,所以放在最后。虽然和众人一样成为了一名IT民工,却有着独特爱好:热爱植物,热爱旅游,热爱摄影。尽管能听从MJ面诲的人不多,但是其一篇《十年》毫无悬念成为酒井文集的镇书之作,从此被流浪歌手谱成曲,弹着冬不拉在草原上代代传唱(这句冷饭版权属于ying@9#)。
Tag:
2007-09-01 23:04 | Category : Blog | Add Comment

北落师门

  最近正好闲着,于是作为练手,写了一个单用户的个人空间代码玩。
  事实上现在Blog服务商很多,就算要自己架,现成的开源代码也很多,比如WordPressMovableTypeZ-blog等等。为什么要自己写一个呢?原因大致有以下几条:
  1. 不愿意再和Blog服务商斗争了,没有一家能提供让我满意的服务。最基本的,我甚至得不到我自己Blog的数据。我现在的Blog在Live Space,问题在于慢且代码限制多,唯一的好处是和MSN绑定了,一更新别人就能看到。当我想搬出的时候,发现我只能从rss里获得最后几篇,没法获得以前的,更没法获得评论。于是曲线救国,先用百度搬家工具端到百度空间,然后再找第三方工具把百度空间的Blog扒成XML。由于百度空间的评论用javascript套了一下,所以评论都没了作者,也就没用了。不过好歹文章是都下来了。所以说,自己的数据,一定要自己保存,爱存XML就存XML,爱存数据库就存数据库,踏实。
  2. 折腾现成的代码挺无聊的。既然要自己架了,且自己闲着,还是自己动手比较好。主要是一直没有用PHP+MySQL写过正经的代码,所以正好拿这个练练手。写的过程中也确实学到了不少东西。这比配一个WordPress换一个模版什么的要长进得多。
  3. 想做一些现有代码没有的功能。WordPress,MovableType之类的毕竟是专门的Blog工具,而我更希望做成一个个人空间。Blog只是其中一项,相册,藏书,文集,等等,都想做在一起。如果说Blog是一个item,那么Book,Photo都是并列的不同类别item。这样可以专门做针对性的数据归类和管理。比如我可以把自己的书都统一存成Book类型的,带个ISBN参数,然后直接就能点击去豆瓣看评论,或者去Google Books看预览。同样的,我管理自己的相片,存一个坐标参数,于是直接可以做成kmz文件,点击就在Google Earth上定位了。诸如此类,还是有很多可以挖掘的地方的。

  于是就动手做了。当然,开始的时候先做简单的,只做Blog功能,慢慢再补充别的。现在前台部分完成度80%左右,已经能看了,而且默认就是纯静态页面发布,浏览速度得到保障。后台管理,反正是自己用,暂时还没怎么做界面设计,能用就行,完全不需要好看,唯一的麻烦就是还没有可见即可得的编辑器,不过暂时可以用Live Writer凑合。至于数据,我原来在水木和Live Space上的文章都已经导入了,评论慢慢再想办法。
  目前这东西还很简陋,比如不支持各种插件,不支持Trackback(这个是还没看文档不知道怎么实现),不支持多用户(没必要),等等,当然,自己用就没什么问题了。从这篇文章开始,我就同时在现有空间和自己的系统里发布Blog了。

  根据我习惯的命名方案,我把这个代码取名为Fomalhaut,中文名北落师门

  顺便,看到这篇文章的如果有知道行情的,帮我推荐一个虚拟空间,要求能支持我挂域名,支持PHP+MySQL,空间大小不是问题,百来兆足够。速度要快些,最重要的是稳定,如果是国外的空间,最好没有被盾的前科。

2007-03-08 11:23 | Category : Blog | Comments (8)

是谁小鸡肚肠?又是谁在流氓?

  首先打开http://blog.sohu.com/robots.txt,看到以下内容:
   User-agent: Googlebot
   Disallow:
   User-agent: baiduspider
   Disallow: /
   User-agent: Nutch
   Disallow:
   User-agent: *
   Disallow: /
  可以看到,搜狐博客禁止了除了Google和Nutch之外一切搜索引擎的抓取,而且还单独把百度拿出来深恶痛绝地鞭尸。这显然是小鸡肚肠的行为,对用户很不负责——因为别人无法通过搜索引擎搜到自己的博客内容。但是且慢,真的如此吗?
  在各个搜索引擎用site:blog.sohu.com进行搜索。
  首先是Google的结果,共有搜索结果417000项,全部是三级域名xxxx.blog.sohu.com这样的首页,任意找一个xxxx.blog.sohu.com去site:一下,可以看到还是都抓到内容的。417000,是一个三级域名的数量,差不多也就是他抓到的搜狐博客的用户数量。
  然后是搜狗的结果,2984875个页面,看到的也都是三级域名,随便找个继续site:,可以看到只有首页没有内容,说明sogou就算是在自己家也还是很道德的。至于为什么sohu博客吃里扒外让Google抓却不让自家的sogou抓,那就要去问张朝阳了。
  接着给出有道的结果:抱歉,没有找到与 "site:blog.sohu.com" 相关的网页。很好,遵纪守法。
  最后隆重推出百度的结果,找到了131000篇,数量不是关键,关键是它的结果从第二篇开始就是内容页面,也许是百度不敢太过分,从外部过来的页面抓了之后看了眼robots.txt,于是不再往下继续,但是好歹,有外链的全给抓了(应该不是全部,否则数量也太少了)。这只有三种可能,一是百度不懂robots.txt的规范,二是百度装作不懂,做了流氓——还好它没全抓,否则就不是流氓而是黑社会了,第三就是只抓外链页面是允许的,我个人感觉这种可能性不大。地震震得w3c网站连不上,所以也确定不了。
  看完sohu的,再来看看流氓百度家的http://hi.baidu.com/robots.txt,内容如下:
   User-agent: Baiduspider
   Disallow:
   User-agent: Googlebot
   Disallow:
   User-agent:
   Disallow: /
  流氓就是流氓,比他强的他不得罪,比他弱的,全部封杀。至于最后那个User-agent为什么不加个*,我就不知道了。这样写是不是符合规范呢?如果不符合,那就是白写,就算页面被人抓了也是白抓。那么来看看site:hi.baidu.com的搜索结果。
  首先还是Google的结果,只有96400个结果,都是每个人的首页!而且搜几个朋友的百度空间,发现只有首页没有内容,也就是说,Google也许只抓了每个人的首页,即使它被允许全抓。
  然后是有道的结果,和Google一样,只有每个人的首页而没有内容,一共171000条。有道还是挺听话的。至于为什么数量几乎是Google的两倍,很简单,因为Google没有抓中文目录,而有道抓了。正好这里顺路鄙视一下百度这么大个家伙居然还允许用户用中文目录名。
  百度自己的结果在这里就没有什么意义了,4980000条,挺多。
  最后是搜狗的结果,667756项。结果很眼熟是吧,没错,就是和百度搜搜狐博客的结果非常像,应该是只抓了外部有链接的,没有继续扒拉。
  好了,结果出来了,搜狐博客和百度空间,毫无疑问,都不是合适的BSP,因为它们连用户内容被检索的自由都不给。相比之下同样是门户的博客,新浪和网易至少没有从robots.txt上去做手脚。
  谁是流氓呢?在能找全robots.txt规范前不下定义,但是比较显然的是,百度流氓的可能性很大,而搜狗的以彼之道还致彼身很可能因为百度自己的写法错误而只能让百度有苦说不出。
2007-01-12 21:30 | Category : Blog | Comments (4)

弱智测试

  刷刷地看到好多好友Blog上都有这个测试,还互相点名。好吧,我就在被点到前,主动点……顺便帮这个网站带去一点流量好了,好歹页面做得还算舒服,不容易。
梦影月痕
100.0%男性倾向,0.0%女性倾向
yodao | 博客男女
  继续点名,学习kickdeer的点法,点前四个看到这个贴子的。什么,你不知道自己是不是前四个?你不知道我怎么知道……
Tag: , , , ,
2006-12-11 23:21 | Category : Blog | Comments (2)

网易在搞什么

  网易推出了自称是功能最全速度最快的博客产品。既然牛吹这么大,就去看看吧。去了它首页,随便点了一个推荐的Blog。好家伙,一屏幕几十个“加载中”,而且很长时间之后没有任何加载出来的征兆,估计后台忙着呢。这就是他传说中采用ajax技术数据交换异步执行的结果。将来任何一个写ajax介绍和经验的人,一定要记住这里有一个极其经典的反面教材。网易向我们展示了ajax滥用的后果,这可是一般情况下看不到的!
  N次刷新之后终于能看到个完整页面了,所谓的功能强大就是把所有你能想到的你想不到的你能用到的你用不到的功能都平铺出来,堆在一起给你看得眼花缭乱不知所云。至于界面,在各大网站一片追求简洁的大好形势下逆流而上,看了几个模板都是非常低龄化的,和qqzone有的一拼了。
  这样的产品,高端用户看不上,低端用户不会用,读者读得一头雾水……真好意思拿出来发布。上次看了会百度空间的web源码之后已经觉得很奇迹了,不过人家虽然代码一团糟,好歹用户体验上设计得很不错。没想到这回还有更奇迹的,从里到外,没觉得有哪点竞争力……
Tag: , ,
2006-09-02 01:16 | Category : Blog | Comments (2)

About Web (1)

  最近看了不少Blog on Blog,也思考了一些问题,包括但又不限于Web 2.0的技术与应用,Blog的功能及发展,等等,所以打算随手写几篇东西下来记录一下。
(1) Blog二分:Media and Space

麦田最近写了个博客即媒体系列(1,2,3),扯了些老话题,不过老瓶装新酒,提出了几个新观点。在我看来,他对Blog的服务需求两类细分很是不错,不过,他的分类方法,分类标准,以及类别名称,非常值得推敲。
麦田把网民中的1.5%分为A类,他们的共同特点是每周更新自己的Blog,因此他觉得他们的需求是获得传播的影响力,他们的Blog,吻合于他的标题,博客即媒体,而剩下的98.5%都是B类,或者不写Blog(那就没啥可说了),或者只是因为每周更新不到一次,所以被他认为需求在于kill time,他们的Blog,被他建议命名称Space。
可是你凭什么把他们的Blog叫做Space,而把每周更新的叫做Blog?仅仅依靠更新频率并不能说明问题。更何况,Blog这个词,本就是草根的化而非精英化的。我并不否认Blog可以分为两类,但绝对不会把其中一类排除出Blog的行列。顺着他的思路走下去,结合用户需求看,Blog的二分分类应该是:
1) Media化的Blog。他们的存在就是为了证明Blog is Media,Blogger本身就是有意或者无意地朝着Media方向发展;第二类则是
2) Space化的Blog。他们更接近一个个人主页/个人空间,形式上自由,内容上随意,目的上,不是为了kill time,而是为了交流,交流的对象是自己的朋友或者朋友的朋友,这与时下流行的Social Network Service平台从目的性来看,颇有几分共同之处。
两者的区分很容易,但是不是更新频率。麦田在这里给的分类过于简单粗暴了。毕竟平面媒体还分日刊周刊月刊季刊呢,为什么非要Blog每周更新才有媒体化需求?更何况就算每天更新,甚至每天更新不止一篇,该是Space的还是Space,比如我从来就没想过我的Blog是Media,如果是或者想要它是,那么我不会这么写,也不会把它放在MSN Space上。
在我看来,下面这些特征可以用来区分一个Blog可以算得上是个Media还是个Space:
1) Blogger本身是个名人,现实世界的名人,或者至少也是个IT精英,挂个CXO头衔的。以新浪博客最早的那批用户为代表。他们的Blog天生就是Media。就算他们一个月写一次,就写今天吃了啥,那还是Media。因为他们本身就会被关注被阅读,只靠名字就够。当然,最近名人越来越学会利用自己的Blog了,无论是炒作还是打官司,说明他们意识到Blog is Media,是可以利用的——尽管也许最早开Blog的时候,他们连Blog是啥都不知道。
2) Blog的内容专一而专业。我订阅的大多是这样的Blog,比如每天看看Keso的东拉西扯,对我来说和每天读点新浪的体育新闻网易的IT新闻没啥区别,都是信息的来源。不知道Keso的固定读者有多少个,但是可以肯定他们的分布广泛,人数众多,这样的Blog,从功能上来看,就是专业性很强的Media。
3) 独立域名。这个说出来肯定有误伤,因为我所知道的好多Space都是有独立域名的,而好多Media是挂靠在BSP下面的。所以这个判断标准不是个强标准,只能做个参考。如果一个Blog要做Media,在我看来,申请个独立域名简单方便而且有效,毕竟这也算是个商标呀。另外,当一个Blog从BSP下出走,改用独立顶级域名的时候,那么可能一定程度上,它有强烈Media化倾向,或者另一种可能,有极端Space倾向。这两者很容易分辨。
4) 读者群体的分布。Space的最显著特点在于读者往往是Blogger的朋友或者朋友的朋友,无论Blogger写的是什么,都是写给他朋友看的。除去误入的之外,Space的绝大多数访问量来自朋友的朋友。至于朋友的朋友圈子有多大,SNS服务商会告诉你。
简单总结下,就是作者和读者共同决定了一个Blog究竟是Media化的还是Space化的,并不是说你天天更新,想让他成为Media,他就是Media的。另外,Space这个概念并不仅仅限于Blog,比如腾讯QZONE,我从来不觉得它是个Blog,但是他确实是Space,是个在特定阶层特定年龄段很流行的Space空间。
最后顺便举个例子,来说明我对Media和Space的划分。这个Blog是我一中学同学的,放在MSN Space上,叫做老姚涂炭。每周更新(有阵子每日更新);访问量挺大,读者数量挺大,评论很多,基本上一篇Blog发表不到一天就能有100篇以上评论留言;写的内容都很专业,不过由于作者涉猎太广所以不专一;被MSN风云榜首页推荐过数次,甚至一度出现在每个中文MSN Space页面顶端的推荐中。这样一个Blog,单看这些数据,恐怕会在很多人看来是个Media,但是在我眼里这还是一个Space而不是Media。它的读者多评论多,是因为Blogger的人缘好,朋友圈大,他的朋友们愉快地在他对书法篮球毕加索英国诗歌的解读下留言,不是因为看懂了,而是因为看过了。这些文字有不少可以去专业网站上发表,但是他还是写在自己Blog上。尽管他单独又开了一个老姚纪实的纯正Space来记录生活,但是从留言人数和内容来分析读者群,他的老姚涂炭并没有Media化倾向,于是这些内容相对其价值而言,能看到的人不多,能看懂并产生共鸣的更少,不过Blogger还是很乐意只和朋友们共享而不是将其发在专业网站上进行探讨。
事实上,老姚遇到的这个选择,对于不做Media的Blogger来说确实是个困扰,老姚把自己Space分成两个,也是在寻找一些解决方法。我对这个问题思考过一阵,有些看法,打算在这个系列下一篇中讲讲,题目也许会叫:中心化·泛中心化·去中心化

Tag: , , ,
2006-07-19 23:27 | Category : Blog | Comments (4)

百度空间上线

  据说是在今天0点,百度空间上线了。又是一个来分一勺羹的。百度的业务铺得很开啊,貌似什么热门他就做什么。随便看了眼,没有能让人眼前一亮的特点,也难怪,这种当量的网站做的东西肯定是中规中矩。和很多现有的blog比,百度空间应该是个不错的选择了,不过这东西连Trackback都不支持,对高端blog用户的吸引力要打个大折扣。另外,百度做搜索起家,百度空间上却看不到他的搜索上的技术优势,只是靠名声和访问量来推。最让我感兴趣的是,百度如何吸引MSN SPACE用户?SPACE一更新,MSN就闪小黄花,这点在用户粘滞度上比百度强得多,这也是MSN SPACE发展迅速的原因。目前百度尚无法在此对抗,那么他是否有其他后继手段来调动用户呢?或者说,假如有一天腾讯的QQ空间不再是现在这么以弱智化低龄化为目标,而是像TM那样,白领化一把,百度的优势又在哪里?
  好友中第一个搬家到百度空间的是iceberg,这是很显然的事,因为百度空间就是他写的……
Tag: , ,
2006-07-13 12:58 | Category : Blog | Comment (1)

Blog以人为本——Blog俱乐部构想

  写下这篇文章的目的,是探讨一种Blog的新的存在形式,这种形式表面上类似于群体Blog(Group Blog),而又与其从根本上不同。在本文中称其为Blog俱乐部(Blog Club),或者直接以其存在形式而言,称其为Blog集合(Aggregative Blog)。
  首先对这些概念做个辨析。Blog自然不用多说,什么是群体Blog?简单地说,群体Blog就是由多个Blogger共同创作维持的Blog。通过《BBS水木清华站群体Blog管理办法》来看,可以这么描述:群体Blog是由多人共同维持的Blog,有若干个管理员更数量更多的Blogger,每个Blogger都可以在该Blog上写自己的Blog,当然是要和该群体Blog主题相关。
  本文要提出的Blog俱乐部,其形式上和群体Blog非常相象,或者说,对于一个不属于该Blog创作者的普通读者来说,他并不能通过他的阅读来区分两者。其实际上的区别是:群体Blog的所有Blog都属于这个群体Blog,而对于Blog俱乐部来说,其本身不包含任何独有的Blog,其所有Blog都属于它的Blogger自己,在该俱乐部中仅以指针形式存在,同样,所有对该Blog俱乐部中的Blog的评论、引用,实际上都直接作用到其Blogger本人的原Blog上。也就是说,Blog俱乐部事实上不是一个实际存在的Blog,而是一个穿着Blog马甲的指针的集合。
  为什么要这么做?这样的Blog俱乐部和群体Blog相比,好处在哪里?正如本文标题而言,在我的观点中,Blog以人为本,所有Blog都应该以Blogger为中心的,而群体Blog恰恰相反,Blogger们围着这一个Blog转,这和一个俱乐部版面又有什么本质区别?一个加入了多个群体Blog的Blogger,他的Blog可能会分散在各个群体Blog里,当然还有一些在他的个人Blog里,但是这样,个人Blog还有什么意义?
  事实上水木的首页Blog推荐就是一个Blog俱乐部的雏形,该俱乐部成员为所有的水木Blogger,管理员为水木的Blog助理,甚至还可以RSS订阅!真的接近完美了。它与一个完整的Blog俱乐部的区别在于它没有自己的Blog页面,点击Blog标题,直接进入了该Blogger的Blog中,于是读者恍然大悟:我刚才看到的只是一个目录罢了。这样的情况,在Blog俱乐部中是不应该存在的,读者自始至终在这个俱乐部中,领会该俱乐部的共同表达,直到他点击一些叫“原始出处”的链接,或者Blogger的名字,于是他会进入那个Blogger的个人世界里——这样的个人世界,才是维持Blog的根本。而群体Blog从本质上来说,与Blog以人为本的气质是冲突的。
  不必担心这样的Blog俱乐部会失去创作的精神而成为一个集散地,因为其中的每篇Blog都是其Blogger自己的精神家园的一部分,都是属于Blogger自己,在Blog俱乐部中陈列而体现自己。而恰恰相反,倘若是群体Blog,那么Blogger在其中所写的,与其最看中的个人Blog必然是割裂的,这样的割裂将不可避免地导致Blogger失去书写动力并最终造成群体Blog的地摊化。
  这样的Blog俱乐部和普通版面,或是俱乐部版面的区别在于其架构基础:Blog俱乐部坚持其Blog属于Blogger个人,而版面不是。就此看来,群体Blog事实上是一个同构异形的俱乐部版面而已。
  所以说,从维持Blog纯净的精神气质出发,Blog俱乐部应该是一种最为合适的群体组织结构。
Tag: ,
2004-08-30 23:29 | Category : Blog | Comments (7)
Subscribe Atom
  • Subscribe to google
  • Subscribe to bloglines
  • Subscribe to zhuaxia
Search
License
  • Creative Commons Lisence
Copyright © 2011 Yang Fan. Powered by Fomalhaut 1.0b.