專題演講一: 10/01(三)上午9:30-12:00
地點: 教育大樓3樓第一會議室
講者: 穆祥明教授 from Univ. of Wisconsin at Milwaukee
講題: Bibliographic Latent Semantic Indexing: No Blames On Users (書目隱性語義索引: 使用者無錯)
心得與收穫: 在聽演講之前,看到是探討關於語義索引的標題就已經讓我昏了一半,因為這是在圖資領域中我一直感到排斥而且從來沒深入了解的領域。而且要接觸一堆數學公式和系統流程圖更是讓我一個頭兩個大阿!不過,在聽了穆教授的演講之後,我發現到其實探討的議題不是那麼的數理導向,而是著重在資料檢索的問題上。而這個問題在我大學的時候修資料庫檢索的課程時就有探討過相關的問題,老師常常告訴我們recall ratio和precision ratio的區別與使用者在使用資料庫的時候若下不同的檢索詞彙與關鍵字的時候,將會得到不同的檢索結果。因此在檢索過程當中要追求recall ratio或precision ratio時,就需要輸入不同檢索詞彙。但是對於一般的使用者而言,他們不知道應該如何透過詞彙的控制取得他們需要的檢索結果,所以,由使用者的知識所輸入的辭彙與資料庫系統中所認定的語義之前形成了落差,導致使用者無法取得所要的結果。
穆教授所做的研究即是透過潛在語義的連結,為使用者取得更多相關的資料,而不會因為語彙的不同而不能檢索到完整的結果。在穆教授的研究之外,在演講的過程中小蝶老師也與大家討論了為何一般人比較喜歡用yahoo而不是google來查詢資料?經過老師的講解之後我才知道原來yahoo是利用人工的方式控制檢索的關鍵字,統計出最常出現的關鍵字查詢,然後將檢索資料的排序依使用者的需求頻率做排列,這也符合了使用者檢索的習慣與偏好,因為他們要查的資料都會排在前面幾頁的檢索結果,這樣也就讓他們覺得yahoo的檢索符合使用者需求,也就造成了越來越多人在找資料的時候會優先使用yahoo查找。
但是對於另一群的使用者如:研究生、學術人員、或是需要查找專業領域的使用者而言,google確實比yahoo能夠提供更豐富的資料。就我的使用經驗來說,我常覺得yahoo無法提供太多學術性或專業性的資料,或是對於一些專業詞彙就無法提供正確的資料,反倒是google能夠提供較多有用的資料。但是在查詢一般性的資料時,像是一些時事性或是熱門的辭彙,我就覺得yahoo比較能夠提供即時的資料,而就會覺得google給的資料太多了,不知從何看起。如此的檢索結果的呈現讓我思考到我們在搜尋資料的時候應該如何決定我們要使用哪一個檢索工具才能得到最符合的結果呢? 就系統製作者的角度來看,都是希望能使用者能檢索到滿意的資料,但是不同需求的使用者所追求的資料是不同的,有些使用者是希望資料越多越好,希望recall ratio高一些,但是有些使用者是需要符合需求,相關性的資料,因此他們希望precision ratio越高越好。如此一來,在使用者的詞彙之下,檢索系統應該如何設計來符合使用者的需求,讓系統的語義與使用者詞彙結合以提供完整並精確的資料,這將會是個持續探討與研究的議題,相信在未來能有所突破!
學術研究與寫作之性質
14 年前
沒有留言:
張貼留言