无尺码精品产品日韩,宇都宫紫苑日韩专区亚洲

APP下載

掃一掃

下載觀察者APP

李德毅院士談人工智能：二十二次說到“記憶”這個詞
- 李德毅中國工程院院士，中國人工智能學(xué)會理事長
分享到：

2016-04-30 08:30:55 字號：A- A A+ 來源：微信公眾號“智能國”

關(guān)鍵字: 人工智能圍棋AlphaGo自動駕駛深度學(xué)習(xí)人腦認(rèn)知弱智能

【AlphaGo戰(zhàn)勝李世石，靠的是窮舉的計算能力？不，是靠“深度學(xué)習(xí)”了一天就能下300萬盤棋積累下的經(jīng)驗。李德毅老師的團(tuán)隊也正在以算法+大數(shù)據(jù)的思路，打造“主要靠經(jīng)驗”的人工智能“老司機(jī)”。他在4月22日的全球人工智能技術(shù)大會所作的《人工智能在奔跑》演講，二十二次說到“記憶”這個詞?！?/strong>

各位同行，我很高興下午做第一個發(fā)言。我的題目有點(diǎn)大，叫人工智能在奔跑。因為人工智能經(jīng)過60年的歷練已經(jīng)到了可以奔跑的時候了，我想講三個問題。先講講圍棋腦，然后再講講智能車駕駛腦，然后再講講決策腦，作為人腦最重要的部分怎么做決策。

先講講圍棋，圍棋其實是中國的文化遺產(chǎn)，中國的圍棋在全世界很有名。就跟中國的乒乓球一樣有名，但乒乓球是舶來品，圍棋是我們中國人的?，F(xiàn)在圍棋最好的是中日韓。圍棋是誰把誰圍住了誰就贏，所以我出了一個題目，叫做形象思維的自動化。下象棋大家都知道主要是吃子，有大小之分。圍棋就不一樣了，圍棋的子沒有大小之分，象棋是八分八的棋盤。我想特別回顧一下歷史，在2011年9月6號，我們中國人工智能學(xué)會組織了九路圍棋，81個格子，讓北郵的圍棋程序Lingo對俞斌，讓俞斌讓兩個子給Lingo，他說不好贏。在2011年的時候包括中央電視臺也播了，俞斌是我們中國圍棋隊總教練，我們的圍棋在世界上可以說是穩(wěn)拿的，兩盤都敗給了Lingo，當(dāng)時認(rèn)為兩三年九路棋盤是有希望的。這是五年前的事情，只不過我們中國人工智能學(xué)會影響不那么大，全世界不一定都感知到了。

到了2016年3月9號，李世石下了19路圍棋，而且最后4：1輸了。為什么？難在哪里？圍棋難以鎖定下一個目標(biāo)，具有更大的不確定性。我有一篇著作叫做“不確定性人工智能”。圍棋的不確定性比象棋大很多，象棋更注重邏輯思維，圍棋在某個狀態(tài)下應(yīng)對的步驟比象棋多很多，既有邏輯思維也更注重形象思維，更大局觀。

我們看看在《自然》雜志上，20個作者寫了AlphaGo的程序，他們采取的辦法。這篇文章里提到一個特定的圍棋棋局，有很多的計算量和推理量。我們中國人有一句話叫做千古無同局，所以歷來把它認(rèn)為是給人工智能一個挑戰(zhàn)的很好的里程碑。那么我們仔細(xì)分析一下，AlphaGo為什么贏？這是我今天要報告的重點(diǎn)。它突破了傳統(tǒng)的程序，構(gòu)建了兩道模仿人類思維的深度卷積神經(jīng)網(wǎng)絡(luò)。第一個網(wǎng)絡(luò)主要擔(dān)當(dāng)棋局態(tài)勢的評估，第二個網(wǎng)絡(luò)是如何落子，這是人機(jī)大戰(zhàn)，如果你知道每一步怎么下的，你會得到一個結(jié)論，那就是沒有看到有天外來客下出不食人間煙火的套路。這句話告訴大家AlphaGo的學(xué)習(xí)能力很強(qiáng)，因為它是我們圍棋手教他的。

所以在全世界一片振動之后，我提出四個問題請大家思考一下。

第一個問題，如果讓AlphaGo或李世石再下一次復(fù)盤，讓李世石原來怎么下還怎么下，請問AlphaGo能不能復(fù)盤，能下出跟原來一樣的嗎？它是以不確定性為強(qiáng)的，能不能重復(fù)？這是第一個問題。

第二個問題，在比賽之前以及比賽之后，這個程序變了沒有？還是原來的程序嗎？我們手機(jī)壞了實在不行重新啟動，還是原來的。AlphaGo的程序還是原來的嗎？它跟李世石下了五盤棋學(xué)到了什么東西。

第三個問題，跟李世石下棋之前，AlphaGo跟別人下過，如果用相同的版本對比的話結(jié)局如何？還有沒有意義？能不能提高AlphaGo的水平。

第四個問題，讓AlphaGo從此以后不再跟高棋手下棋，AlphaGo的程序水平會不會降低？

我覺得這幾個問題可以讓我們?nèi)斯ぶ悄芄ぷ髡呱晕⒍嘞胍幌?。其實在我們眼里李世石只是充?dāng)了一次人工智能發(fā)展成果的測試員而已，他對我們來說只是我們測程序的一次科學(xué)實驗而已，是一個人與一群人的對決，包括棋類高手又包括人工智能高手。你們看deepmind的作者，他們不但是人工智能高手，也是圍棋高手，是兩個領(lǐng)域的能人，這個不容易的。所以我們經(jīng)常講什么叫人機(jī)大戰(zhàn)，人機(jī)大戰(zhàn)實際上是人在前面機(jī)器在后面，或機(jī)器在前面人在后面的一場對決而已。因此從統(tǒng)計學(xué)上來看人機(jī)大戰(zhàn)總的結(jié)局應(yīng)該是5：5。

下面講AlphaGo程序還有很多的不足，比如說它下棋的時候還要有一個助理員拿棋子，它的手還沒做出來，它沒有眼睛，沒有感受和行為能力。這個機(jī)器人一定要有它的感知能力、有行為能力，而它只有思考能力是不夠的。再一個AlphaGo程序目前還沒有情緒、沒有情感，不能現(xiàn)場分析對手的心理狀態(tài)，跟誰下都是一回事，不能夠現(xiàn)場和對手展開心理戰(zhàn)，缺少交互認(rèn)知的能力。我想兩條AlphaGo程序的作者也一定會同意的。

AlphaGo對戰(zhàn)李世石

AlphaGo的成功用了深度卷積神經(jīng)網(wǎng)絡(luò)，但是這個卷積神經(jīng)網(wǎng)絡(luò)有四個毛病。

第一，有太多的學(xué)習(xí)參數(shù)，就是今天上午各位講的權(quán)重系數(shù)，這些系數(shù)的確定具有隨意性。包括有多少個卷積和，怎么卷，怎么下載，這里面隨意性太大。所以我們發(fā)現(xiàn)他們發(fā)表的文章我們做的時候恢復(fù)不了，文章主要的東西沒寫進(jìn)去。

第二，你在學(xué)習(xí)的過程當(dāng)中不能進(jìn)行你的數(shù)據(jù)樣本很大，就能保證算法是正確的，這個事情很糟糕。

第三，現(xiàn)在用的卷積神經(jīng)網(wǎng)絡(luò)更多的還是前面的，這是跟人類學(xué)習(xí)不一樣的。

第四，現(xiàn)在用的對樣本的學(xué)習(xí)是沒有累積性的，我們?nèi)耸怯欣鄯e性的。

因此這四個缺陷是我們?nèi)斯ぶ悄芤朕k法努力克服的。我個人認(rèn)為深度學(xué)習(xí)不管是卷積神經(jīng)網(wǎng)絡(luò)還是其他的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法，都不能是人工智能的終結(jié)者。尤其重要的是我們看到的人都是個性的，而AlphaGo程序目前還沒有定位為個性的，我們需要的張三李四，世界上并不存在一個人類，人類是我們?nèi)说目偡Q而已。

下面第二個議題，駕駛腦。因為圍棋實際上在我看來應(yīng)該是個圍住和不圍住的問題，在統(tǒng)計學(xué)里面是拓?fù)鋵W(xué)的問題，充其量AlphaGo是拓?fù)鋵W(xué)動力學(xué)的問題，如果把這個問題引入到其他領(lǐng)域要很復(fù)雜。比如說開車需要駕駛認(rèn)知，汽車發(fā)明130多年了，走的正好是跟圍棋相反的道路。先走的是行為能力，不管什么時候這個汽車都要能跑，這個很重要，這是汽車工業(yè)的驕傲。我們做了幾百輛車還覺得太少，你能跑惡劣環(huán)境嗎？所以在汽車上配置感知零部件，實現(xiàn)自動駕駛，是在車輛動力學(xué)和人工智能成立的基礎(chǔ)上?，F(xiàn)在我們做自動駕駛，我們覺得自動還不行，當(dāng)你買了這個自動駕駛車回來之后，我會告訴你，你會不滿意的，因為它時不時就說對不起，你請你轉(zhuǎn)入人工駕駛。這次長安的車很多都要人工干預(yù)，這里面缺少了一個問題，光感知是不夠的，一定要有認(rèn)知腦。因此和圍棋腦相反，我們現(xiàn)在走的是現(xiàn)有行為能力，感知能力，目前汽車還需要有認(rèn)知能力，那就變成了機(jī)器人。我們現(xiàn)在希望做一個機(jī)器人，是汽車上比較集中的目標(biāo)。說得再挑戰(zhàn)一點(diǎn)，我們希望做一個飆車機(jī)器人，假如飆車機(jī)器人跑的比人類快，那就更加全面了，就不單是腦子的問題，還有感知和認(rèn)知的問題了。

現(xiàn)在智能駕駛系統(tǒng)很煩惱，因為是離線輔助駕駛。我寫了一個報告，叫最后的繁榮和轉(zhuǎn)型之路。因為你做了那么多的中控設(shè)備，顯示設(shè)備，將來汽車要自己會自駕駛了，這個行業(yè)，這個工業(yè)怎么辦？轉(zhuǎn)向自動駕駛。但是我剛才講了目前的自動駕駛是局部時段，局部區(qū)域，能滿足駕駛的范圍很小。自駕駛說得更多一點(diǎn)是無人駕駛，或者自助駕駛。我們昨天科技部進(jìn)行了重要的答辯，用了以人為本的人機(jī)系統(tǒng)共享，不是單純的由人駕駛，也不是單純的由馬駕駛，而是共同的協(xié)調(diào)駕駛。

既然需要一個駕駛腦，我們就要考慮人腦有哪些功能，需要駕駛腦來承擔(dān)。我們認(rèn)為記憶一點(diǎn)不亞于計算，尤其是長期記憶、短期記憶，或者瞬間記憶，這個形態(tài)是不一樣的，數(shù)據(jù)量也是不同的?，F(xiàn)在所有廠家做的圖像識別，基本上還是在瞬間記憶階段。我們這個課題組不一樣，我們把它做到行政化后面去了，這就是我們的特長。

把人腦中動機(jī)、學(xué)習(xí)和思維、性格、記憶，都用機(jī)器來實現(xiàn)，就可以做一個機(jī)器的駕駛腦。情緒注意力不集中就不要進(jìn)來了，我們希望個性化還是要進(jìn)來的。這樣的情況下我們有了思想，既能有感知信息，把感知信息合并到一起大概三大類。第一塊是路網(wǎng)文件，精確到10厘米左右。第二個是雷達(dá)通道，航天雷達(dá)、超聲雷達(dá)，都叫雷道通道，也是個千里眼。再一個就是攝像頭。這三個通道就好像人的感知器官一樣，很重要，但是哪一路都有不完善的地方。它們都在完成定位、路權(quán)檢測和導(dǎo)航的能力。定位就是我在什么地方，路權(quán)檢測就是周圍有什么，導(dǎo)航就是下一步怎么走。定位里面最重要的就是同步定位和映射，這個要做得好智能駕駛就好了，現(xiàn)在最難的就是這塊。周圍有什么我們用我們的行政化的方法，此時此刻我周圍多大的空間是我可以使用的。下一步怎么做就是方向盤了。

我們的課題組不僅做前面的視覺的感知深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)，我們把這些叫做先視后覺。尤其要感興趣的是視而不覺，邊視邊覺和先覺后視。我多次講駕駛腦對路邊的美女是不用看的，我們強(qiáng)調(diào)要記住當(dāng)前的感知，已有的認(rèn)知對當(dāng)前的感知起重要的作用。因此我們在駕駛腦里面有視圖儀表，通過長期的記憶，工作記憶和瞬間記憶，來記憶不同時間了解交通的信息，最后形成一個動作的執(zhí)行，這就是我們說的感知、認(rèn)知、行動，再感知、再認(rèn)知，再行動。

自動駕駛的未來圖景

其實跟下圍棋相比，駕駛活動更多的是技巧，是記憶或經(jīng)驗。而不是知識、推理和計算。駕駛腦的差異反映個人智力和運(yùn)動能力的差異，一個孩子從小就看得出他有沒有跳芭蕾舞的天賦，其實開車有是大同小異的。為什么兩口子開到最后發(fā)現(xiàn)一個人更會開，他的小腦比另外一個人要發(fā)達(dá)一點(diǎn)。

1 2 下一頁余下全文



標(biāo)簽人工智能圍棋 AlphaGo

本文僅代表作者個人觀點(diǎn)。
責(zé)任編輯:鐘曉雯

搜索

   觀察者頭條查看全部

星辰大海第二站，天問二號為何選它？評論 8

印度人把抵制矛頭對準(zhǔn)了這兩國評論 214

特朗普準(zhǔn)備賣了“美國之音”總部大樓評論 174

美大使“委屈”上了：加拿大抵制美貨是侮辱評論 69

沃爾瑪準(zhǔn)備以關(guān)稅為由漲價，特朗普威脅評論 169

   風(fēng)聞 · 24小時最熱查看全部

   最新視頻查看全部

   最新聞 Hot

特朗普準(zhǔn)備賣了“美國之音”總部大樓

沃爾瑪準(zhǔn)備以關(guān)稅為由漲價，特朗普威脅

馬克龍“搭手示強(qiáng)”，反被埃爾多安“拿捏”

他痛批特朗普撒謊“不值一駁”，“令美國人民蒙羞”

美大使“委屈”上了：加拿大抵制美貨是侮辱

面臨高關(guān)稅壓力，越美完成首次線下部長級磋商

臺“邦交”危機(jī)再起？“不意外，轉(zhuǎn)向或已近尾聲”

“船、箱雙雙告急！兩個月后更糟了”

克宮：“普澤會”有可能，只要…

小米汽車回應(yīng)“部分SU7前保險杠形變”

惡意傳播涉劉國梁不實信息，杜某川、湯某被處罰

韓船企利潤大增，中國被撼動？

美軍高官急眼：中國在拉美居然整了10個，沒人管…

無法一一談判，特朗普放話：將被單方面加稅

湖南懷化舞水河近期出現(xiàn)大量死魚，當(dāng)?shù)鼗貞?yīng)

穆迪下調(diào)美國信用評級，白宮急了：這是政治決定

   快訊

“哈馬斯加沙軍事領(lǐng)導(dǎo)人被打死”，系前領(lǐng)導(dǎo)人辛瓦爾弟弟

江蘇疾控聲明：常榮山與我們無關(guān)

教皇利奧十四世正式任職

學(xué)者三年實地調(diào)查，竟被判AI代筆？！

新疆夜空不明飛行物是什么？揭秘來了

中共中央、國務(wù)院印發(fā)《黨政機(jī)關(guān)厲行節(jié)約反對浪費(fèi)條例》

國家醫(yī)保局釋疑：為什么便宜的X光檢查越來越少，貴的CT檢查越來越多？

漸凍癥“斗士”蔡磊，獲全國表彰

李德毅院士談人工智能：二十二次說到“記憶”這個詞