概描述和泛描述 -網上推廣


《Web信息架構》中有個不恰當翻譯,把label翻譯成了標簽,好像見網友也有提到。我曾經想,如果label是標簽,那么tag是啥?如果tag也是標簽,那么與label有什么區別么?中英文翻譯有時就這么麻煩,完全不知道說的是否一回事。

上周書友會聊到內容組織方式時,有資深同行就提出“標簽與關鍵詞不一樣”的觀點,開始我意思是“它們都一樣,只不過是tags的不同中文翻譯。”后來我才明白他意思,從組織本質上理解沒區別,但關鍵詞由編輯整理提取,質量高;標簽由用戶自由添加,質量差。其實我的看法很簡單,不管編輯還是用戶提供的數據,都不會改變tags這種內容組織方法的本質,所以“是什么”并不重要。

后來這位同行又問“有沒有新東西可以分享?”我當時想了想回答沒有,再想感覺不對,老東西都沒整明白,抄那么多新東西又有啥用?因為我一向認為tag是互聯網技術領域中內容組織的革命性進步,而且這么多年過去,還沒有看到被正確的普及應用。國內很多互聯網從業者根本沒有意識到web design的本質是處理信息和內容,更不用說思考組織方式了。絕大部分同行認識它是因為個叫web2.0的概念,認為“標簽、標簽云”等表現形式是時代特征,僅此而已。

但很快網站創辦者發現,用戶不接受概念,搞不清楚“分類、標簽”的區別。如果把此事情縮影到個人博客上,同樣會發現,就算對互聯網比較熟悉的經常寫blog的信息技術領域從業人員,很多也亂用分類、標簽。針對這問題,我07年曾經在內容、標簽和分類中分析肯定了分類、標簽的作用,并提出個“內容——標簽——分類”的有序多維結構方案。后來與朋友又有過多次探討,現在很多新產品都參考了此思路。

回過頭來想想,為什么要用tag,是因為分類不能滿足用戶的個性化描述需求。那么哪些信息需要個性化描述?比如一篇文章、一張圖片,N個用戶看可能會有N個關鍵詞。相反,書就不太適合,因為作者、出版社、出版年等等這些關鍵信息已經結構并中心化,并且符合用戶心智模型,因此我也不認為“豆瓣”是tags良好應用的典范。

如果再把概念放開了想,對信息的所有描述其實都可以叫標簽、關鍵詞、標記、分類,這些說法模糊而且不嚴謹,是不是在形式上有更好定義?我能想到的答案是概描述、泛描述,叫分類或者標簽都不重要,只需要這兩個關系層次定義即可解決問題,所有BSP, CMS, SNS大同小異。

同時,在搜索引擎友好角度,不管概描述還是泛描述,都可以提升信息檢索效率。尤其跨數據類型的泛描述,是對內容整合的良好補充。在某些人工智能的搜索引擎里,泛描述還可以幫助機器學習,提升命中率。

關于新概念新東西的思考,今天就這么多,完善了曾經對泛描述標簽的思考。我們從來不缺新觀念來引導思路,關鍵應該把老方法想透徹并靈活運用。

原文:http://blog.rexsong.com/?p=6155


arrow
arrow
    創作者介紹
    創作者 pagepe 的頭像
    pagepe

    pagepe的部落格

    pagepe 發表在 痞客邦 留言(0) 人氣()