識(shí)謠言、辨假貨 人工智能已活躍在打假一線
來(lái)源: 科技日?qǐng)?bào) 2019-07-15 16:50:07
“當(dāng)真相在穿鞋的時(shí)候,謊言已經(jīng)跑遍全城。”現(xiàn)代社會(huì),虛假新聞、圖片、視頻,甚至商品等借助網(wǎng)絡(luò)渠道迅速傳播。近日公布的《中老年人上網(wǎng)狀況及風(fēng)險(xiǎn)網(wǎng)絡(luò)調(diào)查報(bào)告》顯示,近六成中老年曾遭受過網(wǎng)絡(luò)謠言的危害。
人們常說“流言止于智者”,要想不被網(wǎng)上的流言和謠言盅惑、傷害,首先需要對(duì)其進(jìn)行科學(xué)甄別,而時(shí)下人工智能正在嘗試擔(dān)任這一角色。那么,在打假一線AI技術(shù)如何做到去偽存真?這樣的“本領(lǐng)”可應(yīng)用在哪些領(lǐng)域?
海量資訊發(fā)布,傳統(tǒng)識(shí)謠模式受限
“虛假信息的產(chǎn)生主要有兩類動(dòng)機(jī):一類是利益驅(qū)動(dòng),2018年發(fā)表于《科學(xué)》的研究發(fā)現(xiàn),要達(dá)到相同的傳播深度,虛假信息的速度是正常信息的20倍;另一類是政治驅(qū)動(dòng),在現(xiàn)有互聯(lián)網(wǎng)經(jīng)濟(jì)中,高效傳播代表著高額經(jīng)濟(jì)價(jià)值,人工智能技術(shù)會(huì)被不法分子用來(lái)左右公眾對(duì)于政治的認(rèn)知和判斷,從而控制輿論,威脅政治安全。研究顯示,2016年美國(guó)總統(tǒng)大選期間,受訪選民平均每人每天接觸到4篇虛假新聞。虛假新聞被認(rèn)為影響了2016年美國(guó)大選和英國(guó)脫歐的投票結(jié)果。”中科院計(jì)算所副研究員、博士生導(dǎo)師曹娟在日前北京舉辦的Women Who Code講座上介紹。
為了減少虛假信息,有必要對(duì)網(wǎng)絡(luò)新聞進(jìn)行認(rèn)證。但大型資訊聚合類平臺(tái)每天的新聞發(fā)布量一般在50萬(wàn)條以上,顯然完全依靠人工認(rèn)證是不現(xiàn)實(shí)的,面向公眾,亟待建立高效的AI識(shí)謠平臺(tái)。
杜克大學(xué)新聞研究中心的調(diào)查顯示:截至2018年2月,全球共有149個(gè)正在活躍運(yùn)營(yíng)的事實(shí)核查類新聞創(chuàng)業(yè)項(xiàng)目,其中北美和歐洲74個(gè)、亞洲7個(gè)。而在一些國(guó)外社交平臺(tái)上,已有自動(dòng)化可信度評(píng)估插件來(lái)顯示信息的可信度。
據(jù)了解,目前國(guó)內(nèi)已有的主要識(shí)謠、辟謠平臺(tái)基本還是依靠專家識(shí)別模式,其存在一定的問題:發(fā)現(xiàn)線索主要依賴用戶舉報(bào),數(shù)量有限,時(shí)效性不強(qiáng),往往是事件已造成負(fù)面影響才“后知后覺”;此外,新聞?wù)J證速度有待提高。Facebook統(tǒng)計(jì),依靠專家辟謠的認(rèn)證模式平均滯后3天,錯(cuò)失辟謠最佳時(shí)期;覆蓋類別受限,專家只能在自身擅長(zhǎng)的領(lǐng)域辟謠,領(lǐng)域?qū)<規(guī)斓亩鄻有詻Q定了人工辟謠平臺(tái)的能力上限。
為提高識(shí)謠效率,目前中科院計(jì)算機(jī)研究所、阿里、騰訊等多家企業(yè)和機(jī)構(gòu)已經(jīng)開展了人工智能識(shí)謠工作。曹娟帶領(lǐng)團(tuán)隊(duì)從2013年開始致力于開展基于人工智能技術(shù)的虛假信息檢測(cè)研究,她介紹,AI識(shí)謠公眾平臺(tái)可自動(dòng)及時(shí)發(fā)現(xiàn)可疑線索并進(jìn)行認(rèn)證,大大降低謠言可能帶來(lái)的危害;通過機(jī)器學(xué)習(xí)算法輔助人工審核,僅需1分鐘即能對(duì)疑似謠言事件發(fā)出預(yù)警;基于數(shù)據(jù)驅(qū)動(dòng)的方法,平臺(tái)還可不斷挖掘出不同類別謠言的特性,實(shí)現(xiàn)對(duì)各種謠言地自動(dòng)識(shí)別。
不過,需要指出的是,“虛假信息識(shí)別是一個(gè)高度復(fù)雜的問題,一方面是虛假的定義并不明確,需要不確定性建模;另一方面是標(biāo)注很困難,需要小樣本學(xué)習(xí)方法。目前,機(jī)器學(xué)習(xí)算法的準(zhǔn)確率尚不足以完全取代人類,但已能夠輔助人類更快更好地審核新聞。”曹娟表示。正如扎克伯格所說,“想要完全依靠AI審核內(nèi)容,可能尚需5—10年時(shí)間”。
多模態(tài)、多層次、多角度揪出假新聞
“虛假新聞往往從選題、文字表述,到配圖都呈現(xiàn)出較強(qiáng)煽動(dòng)性:一般選題集中于社會(huì)熱點(diǎn)或爭(zhēng)議點(diǎn);文字描述中情感激烈;配圖具有視覺沖擊力等。”曹娟剖析道。
曹娟介紹,目前,中科院計(jì)算所開發(fā)的辟謠平臺(tái)已積累數(shù)萬(wàn)條假新聞信息,累計(jì)認(rèn)證數(shù)十萬(wàn)次。通過平臺(tái)積累的數(shù)據(jù),目前可從新聞質(zhì)量的角度把杜撰的新聞文本大致分為三類:一完全杜撰,往往是在真實(shí)存在的實(shí)體上編造情節(jié);二半真半假,可能描述的前半段是真,后半段就展開不可靠的想像,或者一部分是真,但在關(guān)鍵情節(jié)上添油加醋;三舊聞新傳、移花接木,事件本身可能存在,但發(fā)布者故意模糊化甚至篡改原事件中的時(shí)間、地點(diǎn),讓人誤以為事情剛剛發(fā)生在當(dāng)?shù)乇弧?/p>
除去文字造假,圖片視頻造假也越來(lái)越多。“我們將虛假新聞配圖分為復(fù)用的過時(shí)圖片、能引起歧義的誤導(dǎo)性圖片及篡改圖片。假新聞通常呈現(xiàn)出新聞要素缺失、圖像質(zhì)量低、內(nèi)容包含色情敏感廣告等低俗信息,以及圖文不匹配等特點(diǎn)。例如,有些假新聞中的配圖會(huì)出現(xiàn)滿屏彌漫沖天大火、公路凹陷深坑、被棄男童在垃圾廢墟前嚎啕等畫面。”曹娟描述道,“謠言更易形成病毒式擴(kuò)散的趨勢(shì),而真實(shí)新聞的擴(kuò)散速度和爆發(fā)度要溫和許多。”
“從核心技術(shù)上,AI甄別謠言依賴于‘三多’。”曹娟說,一是多模態(tài)數(shù)據(jù),謠言從發(fā)布、傳播到被辟謠的生命周期中,可能會(huì)伴隨產(chǎn)生文字、圖片、視頻、傳播網(wǎng)絡(luò)、參與用戶屬性等多種模態(tài)的數(shù)據(jù),各模態(tài)數(shù)據(jù)均能不同程度指示謠言,例如謠言文字的情感傾向、圖片的視覺沖擊力、傳播網(wǎng)絡(luò)的結(jié)構(gòu)屬性等,但沒有哪種模態(tài)的數(shù)據(jù)擁有獨(dú)立完全的謠言指示能力,所以要盡可能獲取不同模態(tài)的數(shù)據(jù)。
二是多層次表示,深度學(xué)習(xí)技術(shù)有強(qiáng)大的表示學(xué)習(xí)能力,經(jīng)過神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和融合機(jī)制的設(shè)計(jì),AI模型可以在面對(duì)眾多意義、形式、結(jié)構(gòu)都不同的模態(tài)數(shù)據(jù)時(shí),綜合不同層次數(shù)據(jù),自動(dòng)找出最有區(qū)分能力的表示組合,并將待甄別文章對(duì)應(yīng)的文字、圖片、傳播網(wǎng)絡(luò)等融合投射到特征空間中。
三是多角度判斷,AI可以從單一方面(如內(nèi)容、用戶、傳播)給出可信度,也可以全面觀察,給出綜合所有信息的可信度,及時(shí)幫助人們“揪出”可信度不高的信息。
結(jié)合專家經(jīng)驗(yàn)辨別虛假商品
曹娟介紹,目前除了鑒別虛假新聞、虛假圖片,AI虛假檢測(cè)技術(shù)還可以應(yīng)用在對(duì)虛假商品的檢測(cè)上,如基于視覺信息技術(shù)鑒定一些高檔商品的真?zhèn)巍?/p>
2017年,美國(guó)紐約大學(xué)成功研發(fā)出一套假貨鑒定系統(tǒng)Entrupy,用戶利用配有微型相機(jī)的手持設(shè)備對(duì)鑒定物品進(jìn)行拍攝,這個(gè)系統(tǒng)利用機(jī)器學(xué)習(xí)算法,分析圖像,最終確定產(chǎn)品的真實(shí)性。其聯(lián)合創(chuàng)始人介紹,除了表面是屈光的鉆石和瓷器不能檢測(cè)外,這項(xiàng)技術(shù)使用光學(xué)分析可測(cè)試汽車零部件、手機(jī)、充電器、耳機(jī)、夾克和鞋子,甚至原油。
近日,中國(guó)科學(xué)院計(jì)算技術(shù)研究所與國(guó)內(nèi)某奢侈品電商宣布共建聯(lián)合實(shí)驗(yàn)室,探索智能鑒定和智能內(nèi)容分發(fā)、在線鑒定商品業(yè)務(wù)等內(nèi)容。那么,AI如何對(duì)商品,如包、鞋辨別真假;在識(shí)別假貨方面,AI可替代專家嗎?
“與人識(shí)別假貨相比,在強(qiáng)度、效率等方面,AI有著突出表現(xiàn)。例如,一般識(shí)別假LV包的專家,工作一天只能鑒定五六個(gè)包,而AI篩查一個(gè)包僅需幾分鐘。實(shí)際操作中,AI先在大量篩選中發(fā)現(xiàn)異常情況,報(bào)警示錯(cuò),再由專家來(lái)做進(jìn)一步甄別。即以AI技術(shù)打假為主、以人工審核為輔,AI還不能替代專家。”曹娟說。
曹娟表示,虛假商品檢測(cè)可形式化為異常檢測(cè)問題。正品樣本往往量很大,但仿品樣本量很小,甚至為零。這時(shí)候,只能對(duì)大量正品進(jìn)行建模表示,然后對(duì)待檢測(cè)樣本,要看它與正品相比是否存在異常。但單純的數(shù)據(jù)學(xué)習(xí)是困難的,鑒別中還要結(jié)合鑒定專家的經(jīng)驗(yàn)知識(shí),以引導(dǎo)模型學(xué)到快速定位異常區(qū)域的能力;同時(shí),模型通過數(shù)據(jù)驅(qū)動(dòng)發(fā)現(xiàn)的視覺規(guī)律,也會(huì)反饋給專家。因此,這是一個(gè)專家和模型相互學(xué)習(xí)、迭代提高的過程。
標(biāo)簽:
相關(guān)閱讀
猜你喜歡
ipod touch有什么功能?touch蘋果皮是什么?
2022-06-17 16:00:32
雙wifi是什么意思啊? 雙頻wifi好處有哪些?
2022-06-17 15:59:08
首套國(guó)產(chǎn)化深水水下采油樹正式投入使用
2022-06-17 15:57:39
研究人員發(fā)現(xiàn):細(xì)菌“親密行為”或解釋抗生素耐藥性成因
2022-06-17 15:56:47
未來(lái)手機(jī)可像樂高積木般搭建 相關(guān)研究發(fā)表在《自然·電子學(xué)》上
2022-06-17 15:55:47
待機(jī)動(dòng)畫是什么意思? 電腦待機(jī)動(dòng)畫怎么弄?
2022-06-16 16:40:55
壓縮文件kz怎么轉(zhuǎn)換 kz文件怎么打開如何解壓kz文件?
2022-06-16 16:39:05
研究人員發(fā)現(xiàn)常見大麥蟲能吃掉塑料垃圾
2022-06-16 16:36:14
將人類基因與其功能一一對(duì)應(yīng) 項(xiàng)目數(shù)據(jù)在線發(fā)表于《細(xì)胞》雜志上
2022-06-16 16:35:45
“智能皮膚”可探測(cè)微生物 有助促進(jìn)靈敏機(jī)器人和智能假肢的研發(fā)
2022-06-16 16:35:14
xv轉(zhuǎn)rmvb格式轉(zhuǎn)換器xv如何轉(zhuǎn)換成rmvb?視頻怎么轉(zhuǎn)rmvb格式?
2022-06-15 16:42:04
巨大的“鱷魚臉”恐龍被發(fā)現(xiàn) “歐洲最大的陸地捕食者”
2022-06-15 16:39:13
研究發(fā)現(xiàn):犬類與人為友的遺傳線索
2022-06-15 16:36:32
超靈敏磁強(qiáng)計(jì)可將信號(hào)功率放大64% 并顯示出創(chuàng)紀(jì)錄的33%的超高對(duì)比度
2022-06-15 16:33:17
視網(wǎng)膜上這類細(xì)胞在近視形成中起重要作用 相關(guān)論文發(fā)表在《科學(xué)·進(jìn)展》上
2022-06-15 16:32:50
黑鯊618狂歡盛典福利多,購(gòu)黑鯊最新旗艦至高立減800元
2022-06-15 15:01:28
油價(jià)破十,雙擎當(dāng)時(shí) 百公里4.8L的混動(dòng)皓極即將預(yù)售
2022-06-15 14:26:16
今日訊!載人航天工程30年 聽航天設(shè)計(jì)師們?cè)趺凑f
2022-06-13 09:44:58
每日聚焦:中國(guó)天眼“看到”持續(xù)活躍快速射電暴
2022-06-13 09:57:03
焦點(diǎn)快報(bào)!視網(wǎng)膜上這類細(xì)胞在近視形成中起重要作用
2022-06-13 09:46:52
訊息:揭秘“時(shí)間魔盒”原子鐘:三千萬(wàn)年誤差小于一秒
2022-06-13 09:43:48
今日?qǐng)?bào)丨畝產(chǎn)801.72公斤:中國(guó)超強(qiáng)筋小麥單產(chǎn)新紀(jì)錄誕生
2022-06-13 09:39:01
要聞:商用迎來(lái)三周年之際:5G全連接工廠有啥不一樣
2022-06-13 09:43:15
視點(diǎn)!三家網(wǎng)店三個(gè)運(yùn)營(yíng)商 FOREVER21的低價(jià)策略還能奏效?
2022-06-13 08:37:45
時(shí)訊:叮咚買菜再退一城 前置倉(cāng)還沒過春天就入冬了?
2022-06-13 08:49:11