美國(guó)帕洛阿爾托研究中心近日對(duì)3200萬(wàn)條英語(yǔ)tweet進(jìn)行研究之后發(fā)現(xiàn),34%的Twitter用戶沒(méi)有Twitter用戶資料中提供有效的地理信息。
66%為有效地理信息,16%為非地理信息,18%為空信息
研究人員隨機(jī)搜集了3200萬(wàn)條英語(yǔ)微博,從中隨機(jī)選擇1萬(wàn)名活躍用戶,對(duì)其位置信息進(jìn)行研究。
研究發(fā)現(xiàn),只有66%的Twitter用戶在這一欄填寫(xiě)了有效的地理信息。在不提供真實(shí)位置信息的34%用戶之中,研究人員發(fā)現(xiàn)了一些趨勢(shì)。例如,部分用戶喜歡在地址這一欄中表達(dá)對(duì)某位名人的欣賞如賈斯汀·比伯(Justin Bieber)、布蘭妮等。另一個(gè)趨勢(shì)是在地址欄中表達(dá)不愿透露位置信息的強(qiáng)烈意愿如“不告訴你”、“管你鳥(niǎo)事”等。另外一些常見(jiàn)的是在地址欄中寫(xiě)上蔑視他人的話,如“藐視你們”,或者是非地球地址,如“外太空”,性相關(guān)內(nèi)容或笑話,甚至是在此表達(dá)對(duì)現(xiàn)在地址的厭惡,例如一名用戶寫(xiě)的是“地獄”。
這項(xiàng)研究的意義在于,它提醒研究人員,簡(jiǎn)單地將Twitter數(shù)據(jù)組輸入到地理解碼器中只會(huì)得到錯(cuò)誤的結(jié)果。因?yàn)榈乩斫獯a器會(huì)默認(rèn)所有信息請(qǐng)求都是地理位置請(qǐng)求,也會(huì)對(duì)這些信息進(jìn)行定位。
因此,為了確定一系列微博的真實(shí)地理位置,研究人員應(yīng)該首先使用地理解析服務(wù)將地理信息和非地理信息區(qū)分開(kāi)來(lái)才行。(張和)
{{item.content}}