-
麻省理工研究新成果:AI可識(shí)別假新聞 還能辨別個(gè)人偏見(jiàn)
關(guān)鍵字:互聯(lián)網(wǎng)時(shí)代,假新聞鋪天蓋地,而且極具迷惑性,F(xiàn)acebook一度深陷虛假新聞的泥淖,不但被控影響了美國(guó)總統(tǒng)大選結(jié)果,甚至引發(fā)了德國(guó)政府的巨額罰金。甚至連以公信力著稱(chēng)的BBC也難以幸免,比如BBC北安普頓分站的推特賬號(hào)就曾發(fā)過(guò)這樣一條消息:
Breaking News: President Trump is injured in arm by gunfire #Inauguration.(勁爆消息:特朗普總統(tǒng)在就職典禮后遭遇槍擊,手臂受傷。)
10月4日,麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)在其官網(wǎng)發(fā)布了一則新聞,宣稱(chēng)該實(shí)驗(yàn)室與卡塔爾計(jì)算研究所(Qatar Computing Research Institute)的研究人員合作,已經(jīng)研究出一種可以鑒別信息來(lái)源準(zhǔn)確性和個(gè)人政治偏見(jiàn)的AI系統(tǒng),該研究成果將于本月底在比利時(shí)布魯塞爾召開(kāi)的2018自然語(yǔ)言處理經(jīng)驗(yàn)方法會(huì)議(EMNLP)上正式公布。
研究人員用這個(gè)AI系統(tǒng)創(chuàng)建了一個(gè)包含1000多個(gè)新聞源的開(kāi)源數(shù)據(jù)集,這些新聞源被標(biāo)注了“真實(shí)性”和“偏見(jiàn)”分?jǐn)?shù)。據(jù)稱(chēng),這是類(lèi)似數(shù)據(jù)集中收錄新聞源數(shù)量最多的數(shù)據(jù)集。
研究人員寫(xiě)道:“打擊‘假新聞’的一種(有希望的)方法是關(guān)注消息來(lái)源?!薄半m然‘假新聞’(帖子)主要在社交媒體上傳播,但他們?nèi)匀挥凶畛鮼?lái)源,即某個(gè)網(wǎng)站,因此,如果一個(gè)網(wǎng)站曾經(jīng)發(fā)布過(guò)假新聞,很有可能未來(lái)還會(huì)發(fā)布?!?
AI系統(tǒng)的新穎之處在于它對(duì)所評(píng)估的媒介有廣泛的語(yǔ)境理解,沒(méi)有單獨(dú)從新聞文章中提取特征值(機(jī)器學(xué)習(xí)模型所訓(xùn)練的變量),而是兼顧了維基百科、社交媒體,甚至根據(jù)url和web流量數(shù)據(jù)的結(jié)構(gòu)來(lái)確定可信度。
該系統(tǒng)支持向量(SVM)訓(xùn)練來(lái)評(píng)估事實(shí)性和偏差,真實(shí)性分為:低、中、高;政治傾向分為:極左、左、中偏左、中偏右、右、極右。
根據(jù)該團(tuán)隊(duì)所述,系統(tǒng)只需檢測(cè)150篇文章就可以確定一個(gè)新的源代碼是否可靠。它在檢測(cè)一個(gè)新聞來(lái)源是否具有高、低或中等程度的“真實(shí)性”方面的準(zhǔn)確率為65%,在檢測(cè)其政治傾向是左傾、右傾還是中立方面的準(zhǔn)確率為70%。
AI系統(tǒng)分析示例
在上圖顯示的文章中,AI系統(tǒng)對(duì)文章的文案和標(biāo)題進(jìn)行了六個(gè)維度的測(cè)試,不僅分析了文章的結(jié)構(gòu)、情感、參與度(在本例中,分析了股票數(shù)量、反應(yīng)和Facebook上的評(píng)論),還分析了主題、復(fù)雜性、偏見(jiàn)和道德觀念,并計(jì)算了每個(gè)特征值的得分,然后對(duì)一組文章的得分進(jìn)行平均。
“真實(shí)性-偏見(jiàn)”預(yù)測(cè)模型圖
維基百科和Twitter也被加入了AI系統(tǒng)的預(yù)測(cè)模型。正如研究者們所言,維基百科頁(yè)面的缺失也許說(shuō)明了一個(gè)網(wǎng)站是不可信的,或者網(wǎng)頁(yè)上可能會(huì)提到這個(gè)問(wèn)題的政治傾向是諷刺的或者明顯是左傾的。此外,他們還指出,沒(méi)有經(jīng)過(guò)驗(yàn)證的Twitter賬戶,或者使用新創(chuàng)建的沒(méi)有明確標(biāo)注的賬戶發(fā)布的消息,不太可能是真的。
該模型的最后兩個(gè)向量是URL結(jié)構(gòu)和web流量,可以檢測(cè)試圖模仿可信新聞來(lái)源的url(例如,“foxnews.co”),參考的是一個(gè)網(wǎng)站的Alexa排名,該排名根據(jù)網(wǎng)站總瀏覽量進(jìn)行計(jì)算。
該團(tuán)隊(duì)在MBFC(Media Bias/Fact Check )網(wǎng)站的1066個(gè)新聞源上對(duì)此AI系統(tǒng)進(jìn)行了訓(xùn)練。他們用收集的準(zhǔn)確性和偏見(jiàn)數(shù)據(jù)手工標(biāo)注網(wǎng)站信息,為了生成上述數(shù)據(jù)庫(kù),研究人員在每個(gè)網(wǎng)站上發(fā)布了10-100篇文章(總計(jì)94,814篇)。
正如研究人員在他們的報(bào)告中煞費(fèi)苦心的介紹所示,并不是每一個(gè)特征值都能有效預(yù)測(cè)事實(shí)準(zhǔn)確性或政治偏見(jiàn)。例如,一些沒(méi)有維基百科頁(yè)面或建立Twitter檔案的網(wǎng)站有可能發(fā)布的信息是公正可信的,在Alexa排名靠前的新聞來(lái)源并不總是比流量較少的新聞源更公正或更真實(shí)。
研究人員有一個(gè)有趣的發(fā)現(xiàn):來(lái)自虛假新聞網(wǎng)站的文章更有可能使用夸張和情緒化的語(yǔ)言,左傾媒體更有可能提到“公平”和“互惠”。與此同時(shí),擁有較長(zhǎng)的維基百科頁(yè)面的出版物通常更可信,那些包含少量特殊字符和復(fù)雜子目錄的url也是如此。
未來(lái),該團(tuán)隊(duì)打算探索該AI系統(tǒng)是否能適應(yīng)其他語(yǔ)言(它目前只接受過(guò)英語(yǔ)訓(xùn)練),以及是否能被訓(xùn)練來(lái)檢測(cè)特定區(qū)域的偏見(jiàn)。他們還計(jì)劃推出一款A(yù)pp,可以通過(guò)“跨越政治光譜”的文章自動(dòng)回復(fù)新聞。
該論文的第一作者、博士后助理拉米?巴利(Ramy Baly)表示:“如果一個(gè)網(wǎng)站以前發(fā)布過(guò)假新聞,他們很可能會(huì)再次發(fā)布。”“通過(guò)自動(dòng)抓取這些網(wǎng)站的數(shù)據(jù),我們希望我們的系統(tǒng)能夠幫助找出哪些網(wǎng)站可能首先這么做。”
當(dāng)然,他們并不是唯一試圖通過(guò)人工智能打擊假新聞傳播的機(jī)構(gòu)。
總部位于新德里的初創(chuàng)公司MetaFact利用NLP算法來(lái)標(biāo)記新聞報(bào)道和社交媒體帖子中的錯(cuò)誤信息和偏見(jiàn);SAAS平臺(tái)AdVerify.ai于去年推出beta版,可以分析錯(cuò)誤信息、惡意軟件和其他有問(wèn)題的內(nèi)容,并可以交叉引用一個(gè)定期更新的數(shù)據(jù)庫(kù),其中包含數(shù)千條虛假和合法的新聞。
前文中也提到過(guò),F(xiàn)acebook一度深陷假新聞的泥淖,已經(jīng)開(kāi)始嘗試使用“識(shí)別虛假新聞”的人工智能工具,并于近期收購(gòu)了總部位于倫敦的初創(chuàng)公司Bloomsbury AI,以幫助其鑒別消除假新聞。
假新聞會(huì)被消除嗎?
然而,一些專(zhuān)家并不相信人工智能可以勝任這項(xiàng)任務(wù)??▋?nèi)基梅隆大學(xué)機(jī)器人研究所(Carnegie Mellon University Robotics Institute)的科學(xué)家迪恩波默洛(Dean Pomerleau)在接受外媒 the Verge 采訪時(shí)表示,人工智能缺乏對(duì)語(yǔ)言的微妙理解,而這種理解是識(shí)別謊言和虛假陳述所必需的。
“我們最初的目標(biāo)是建立一個(gè)系統(tǒng)來(lái)回答‘這是假新聞,是或不是?’”他說(shuō),“但我們很快意識(shí)到,機(jī)器學(xué)習(xí)無(wú)法勝任這項(xiàng)任務(wù)。”
但是,人類(lèi)事實(shí)核查者做的不一定比AI更好。今年,谷歌暫停了“事實(shí)核查”(Fact Check)這一標(biāo)簽,該標(biāo)簽曾位于谷歌新聞報(bào)道欄,此前保守派媒體也曾指責(zé)谷歌對(duì)他們表現(xiàn)出了偏見(jiàn)。
不過(guò),無(wú)論最終鑒別假新聞和個(gè)人偏見(jiàn)的解決方案是AI系統(tǒng)還是人工,抑或兩者兼而有之,假新聞被徹底消除的那一天都不會(huì)立刻到來(lái)。
據(jù)咨詢公司Gartner預(yù)測(cè),到2022年,如果目前的趨勢(shì)不變,大多數(shù)發(fā)達(dá)國(guó)家的人看到的虛假信息將會(huì)多于真實(shí)信息。
- 原標(biāo)題:MIT新研究成果:AI可識(shí)別假新聞 還能辨別個(gè)人偏見(jiàn)
- 責(zé)任編輯:趙曉明
- 最后更新: 2018-10-06 17:53:37
-
谷歌同意就年齡歧視案和解 金額未公開(kāi)
2018-10-06 16:04 -
戴爾時(shí)隔5年再次申請(qǐng)紐交所上市 估值將達(dá)700億美元
2018-10-06 08:50 商業(yè) -
13名民企專(zhuān)家進(jìn)入火箭軍“智庫(kù)”,與國(guó)家隊(duì)待遇同等
2018-10-06 08:30 科技前沿 -
硬件被植入中國(guó)“惡意芯片”?蘋(píng)果亞馬遜辟謠
2018-10-05 16:40 網(wǎng)絡(luò)謠言 -
最大規(guī)模中國(guó)人基因組測(cè)序完成 發(fā)現(xiàn)獨(dú)特病毒DNA分布
2018-10-05 15:00 科技前沿 -
谷歌無(wú)人車(chē)離奇車(chē)禍曝光:人類(lèi)安全員睡著后,誤觸關(guān)閉了自動(dòng)駕駛
2018-10-04 21:17 -
歐洲宇航員正學(xué)中文 盼能搭“神舟”
2018-10-04 12:01 航空航天 -
今年諾貝爾化學(xué)獎(jiǎng)被生物學(xué)家搶走了
2018-10-04 09:35 諾貝爾獎(jiǎng) -
“逃犯克星”:國(guó)家技術(shù)太先進(jìn),要做該做的事情
2018-10-03 23:04 依法治國(guó) -
騰訊3.176億美元增持B站股份
2018-10-03 22:29 大公司 -
軟銀或5億美元投“作業(yè)幫”
2018-10-03 20:36 商業(yè) -
第三位物理諾獎(jiǎng)女性得主:偶然加班讓她比肩居里夫人?
2018-10-03 08:35 諾貝爾獎(jiǎng) -
陳列平與諾獎(jiǎng)失之交臂 原因有三
2018-10-03 08:26 諾貝爾獎(jiǎng) -
電視臺(tái)再遇寒冬 衛(wèi)視招商淪為求生欲大作戰(zhàn)
2018-10-02 20:32 -
Win10政府版未過(guò)審核卻被地方政府采購(gòu)折射自主可控亂局
2018-10-02 20:15 -
一下科技的十字路口
2018-10-02 20:08 -
55年來(lái)首位女性!美法加激光物理學(xué)家分享諾獎(jiǎng)
2018-10-02 18:04 -
18年來(lái),日本人年均拿一個(gè)諾獎(jiǎng)
2018-10-02 16:16 日本 -
嫦娥六號(hào)將搭載10公斤國(guó)際載荷
2018-10-02 15:28 航空航天 -
90秒,展現(xiàn)魔都科技工業(yè)之美!
2018-10-02 15:08 觀網(wǎng)看片
相關(guān)推薦 -
美國(guó)發(fā)布首份AI備忘錄,“得防中國(guó)戰(zhàn)略突襲” 評(píng)論 53普京回應(yīng)“朝軍援俄”傳聞 評(píng)論 209“我們目前世界領(lǐng)先,但中國(guó)人正敲開(kāi)我們的大門(mén)” 評(píng)論 147“不止美德,北約至少七國(guó)反對(duì)” 評(píng)論 83134條!金磚通過(guò)《喀山宣言》,“將在聯(lián)合國(guó)分發(fā)” 評(píng)論 189最新聞 Hot
-
美國(guó)發(fā)布首份AI備忘錄,“得防中國(guó)戰(zhàn)略突襲”
-
“英國(guó)軍情五處完全在胡說(shuō)八道”
-
普京回應(yīng)“朝軍援俄”傳聞
-
被批“中國(guó)有支票美國(guó)有清單”,他又畫(huà)餅忽悠…
-
又嗆上了:野蠻人也好意思自詡捍衛(wèi)文明…
-
沒(méi)中國(guó)能成嗎?澳大利亞部長(zhǎng)這么說(shuō)
-
特朗普威脅襲擊莫斯科市中心?普京回應(yīng)
-
“我們目前世界領(lǐng)先,但中國(guó)人正敲開(kāi)我們的大門(mén)”
-
“我不太喜歡談?wù)摳?jìng)爭(zhēng),但我開(kāi)的是小米”
-
盧卡申科評(píng)“朝軍援俄”:胡說(shuō)八道,普京不是這性格
-
“不止美德,北約至少七國(guó)反對(duì)”
-
華裔老板拒絕“背書(shū)”哈里斯,加州第一大報(bào)編委辭職
-
英高級(jí)外交官搶、奪、撕...扎哈羅娃怒斥
-
連他都不敢說(shuō),“怕被特朗普?qǐng)?bào)復(fù)”
-
134條!金磚通過(guò)《喀山宣言》,“將在聯(lián)合國(guó)分發(fā)”
-
“我們?cè)缸鲆磺蟹现袊?guó)利益的事”
-