文/楊潔
編輯/葉麗麗
18歲的微軟小冰已經成為一個“天才少女”。
從第一代到第六代,“微軟小冰”從語音助手、陪伴機器人,到金融新聞寫手再到全能歌舞藝人等,“小冰”在不斷的迭代中,開始了在創(chuàng)造領域的探索與商業(yè)化的進程。
在5.16微軟小冰人工智能創(chuàng)造媒體說明會上,微軟發(fā)布了小冰人工智能創(chuàng)造方面的進展,宣布了人工智能小冰的繪畫模型,該模型通過對過往四百年藝術史上236位人類畫家畫作的學習,實現(xiàn)了具有一定水準的原生繪畫創(chuàng)作能力。同時,發(fā)布了“少女畫家小冰”繪畫創(chuàng)作小程序。
“關于琴棋書畫,Google把棋做完了,我們把剩下的三個做完了?!?/strong>微軟(亞洲)互聯(lián)網(wǎng)工程院副院長、微軟小冰全球產品線負責人李笛說道。
微軟(亞洲)互聯(lián)網(wǎng)工程院副院長
微軟小冰全球產品線負責人李笛
在此之前,微軟小冰已經服務于各個垂直領域,例如在金融摘要領域服務國內超過90%的金融機構交易員,在電視廣播節(jié)目領域服務中國及日本63家電臺電視臺,在智能銷售助手領域覆蓋日本22.5%的日本全國人口等。
當很多人對微軟“小冰”的印象還停留在最初微信里的聊天機器人,小冰已經在全球收獲9億內容觀眾,1.2億月活躍用戶,在同類人工智能基礎框架中居全球第一。
微軟似乎并不打算讓小冰成為一個功能性的機器人,而是盡可能地賦予小冰個性、脾氣、情商,讓小冰與人類的溝通交流更加自然融洽。
而與此同時,小冰已經嘗試在各個領域的商業(yè)化布局。
微軟小冰化身“少女畫家”
“在2019屆中央美院的畢業(yè)生中,有一位叫夏語冰的同學,正在參加2019屆的研究生畢業(yè)畫展,而這位同學的‘真身’則是微軟小冰?!痹诎l(fā)布會現(xiàn)場,微軟(亞洲)互聯(lián)網(wǎng)工程院微軟小冰人工智能創(chuàng)造及商業(yè)事業(yè)部總經理徐元春介紹了小冰作為一個畫家的成長過程。
從18歲的小冰到“少女畫家”,作為小冰團隊一個秘密的研發(fā)項目,到今天為止已經持續(xù)了整整22個月。
據(jù)徐元春介紹,培養(yǎng)微軟小冰學習繪畫,是他所領導的團隊目前為止進行的時間最長、最艱苦的一個項目。
少女畫家小冰的畢業(yè)畫展
“從微軟的角度來說,我們所想要做的事情是更加底層、基礎的框架,特別是針對這些新興的產業(yè)。”李笛告訴鋅財經。
徐元春介紹,從確定做這件事開始,團隊陸續(xù)把小冰不同時期的作品發(fā)到網(wǎng)上,放到論壇,從最開始被大家忽略,到慢慢有人開始表揚,追捧。
“市面上有些通過神經網(wǎng)絡大量生成,從幾萬幅甚至幾十萬幅的作品里能挑出一兩幅還不錯的作品,這本質上不算是人工智能的創(chuàng)作,它沒有真正實現(xiàn)創(chuàng)造力,微軟也不想要純粹工具化的濾鏡或者技術?!毙煸赫f,團隊開始之初,其實并不清楚模型要如何搭建才能夠實現(xiàn)原定的目標,在這個過程中,只能不停地試錯,嘗試不同模型和算法的能力。
徐元春直言,這的確是一個漫長、痛苦的艱辛過程。
微軟小冰的畫作
而現(xiàn)在的小冰,通過對藝術史上236位著名人類畫家畫作的學習,習得他們的技法、表現(xiàn)力和視角,在受到文本或其它創(chuàng)作源激發(fā)時,能夠獨立完成100%原創(chuàng)的繪畫作品。
這種原創(chuàng)性不僅體現(xiàn)在構圖,也體現(xiàn)在用色、表現(xiàn)力和作品中包含的細節(jié)元素,接近專業(yè)人類畫家水準。
與其他現(xiàn)有技術相比,這一繪畫模型不同于隨機畫面生成,也不同于對已有畫面的風格遷移變換或濾鏡效果處理。
鋅財經體驗“少女畫家小冰”小程序的一幅畫作
同時,發(fā)布會上還披露了微軟人工智能自動生成有聲讀物的技術進展,并正式發(fā)布微軟小冰繪畫模型及演唱模型的第五個版本。目前,微軟小冰在文本創(chuàng)作、語音創(chuàng)作與視覺創(chuàng)作方面均取得了一定進展。其中,語音創(chuàng)作主要覆蓋音樂、有聲讀物和電臺電視節(jié)目三個領域,人工智能演唱模型已迭代至第五個版本,并于上月在日本宣布與AVEX唱片公司合作,日本版本的微軟小冰成為AVEX旗下人工智能歌手。
文本創(chuàng)作目前主要覆蓋詩歌、金融摘要及研報等兩個領域。
在金融領域,微軟小冰是目前全球范圍內規(guī)模第一的金融文本摘要生成平臺。自2017年11月起,微軟與萬得資訊、華爾街見聞等國內主要金融信息服務提供商合作,為其用戶提供由人工智能技術生成的上市公告文本摘要。上述服務覆蓋全部26類金融類別,服務對象包括國內90%以上的金融機構交易員及40%以上的個人金融交易者。
基于文本的人工智能創(chuàng)造,小冰撰寫的金融摘要,已經做到了產業(yè)量產落地。
基于文本的人工智能創(chuàng)造
李笛提到,人工智能創(chuàng)造并不是以擊敗人類為目標,而是著眼于在達到與相應人類創(chuàng)造者同等質量水準的前提下,充分發(fā)揮人工智能快速學習、高并發(fā)與穩(wěn)定性等特點。在技術的加持下,一個“高度定制化”內容的時代正在到來,從內容的推薦,到內容的呈現(xiàn)形式,甚至是內容本身,都在面對“高度定制化”的用戶需求。
當人工智能達到一定的創(chuàng)作水平,將可能協(xié)助彌補這一供需關系上的短板。
小冰“大腦”中的情感計算框架
在整個人工智能基礎框架中,分為兩個方向。一是以IQ為基礎特征,搭配相當多的模塊,讓其更好的完成任務,或者傳遞知識;另一種框架是以EQ為基礎特征,具備一定的情商。
從2014年至今,小冰一上來就瞄準了EQ方向,這也是小冰會從社交媒體切入,尋找跟用戶交流的場景。
微軟方面介紹,第三代小冰已經可以主動引導對話,但存在的問題是,互動感并不強。2017年,微軟在第五代小冰中引入了全雙工語音交互感官技術,這項新技術可以預測人類即將說出的話,并且生成回應,控制對話節(jié)奏。
在去年七月份,微軟(亞洲)互聯(lián)網(wǎng)工程院發(fā)布第六代小冰的時候,也著重強調了微軟小冰的情感計算框架,設計目標是讓人工智能擬合情商,更像人,融入人類社會。
微軟小冰的情感計算框架
與其他AI系統(tǒng)或產品最大的不同在于,其他AI著重于知識和完成任務,小冰要攻克的是擬合創(chuàng)造力和情感。
李笛介紹,最開始的時候,整個行業(yè)都在追求建立人工智能在不同領域具備IQ的能力,如果這些IQ的能力可以非常好地做出來,再做下一個,然后再做下一個,最后可以形成一個足夠大的集合,但是這個并不夠。
“我們有幸在比較早的時候開始布局這個領域?!?李笛介紹,從理念上來講,EQ和IQ并不是相互排斥的,并不是說發(fā)展情商就不應該去發(fā)展智商,反過來也是一樣,它們是一種相互融合的過程,當人工智能在學習人類IQ的時候,EQ其實起到了非常大的作用。
小冰瞄準EQ方向
李笛提到,在實際的研究和研發(fā)過程中,經過大量和人類之間的交互,會發(fā)現(xiàn)無論怎么樣的人工智能系統(tǒng),哪怕是一個完成任務的人工智能系統(tǒng),都需要有基礎的EQ的,就像是大地一樣。而不同的IQ是建立在這個大地上面的一棵一棵樹木,如果沒有這個大地的土壤去關注整個人工智能和人類之間的關聯(lián),單獨的IQ就和其它APP沒有太大區(qū)別。
微軟小冰的商業(yè)化試水
從2014年至今,經過近五年時間的發(fā)展,小冰升級至第六代,技能形態(tài)越來越豐富,從主持人,到歌手,各種跨界。如今,小冰又開始進行全面的商業(yè)化試水,顯然,小冰目前正在快速道上正向行駛。
商業(yè)化一直是人工智能技術討論的焦點,也微軟小冰面臨的機會和挑戰(zhàn)。
對于繪畫這個項目來說,小冰的產業(yè)落地在設計領域。據(jù)徐元春介紹,團隊在過去半年時間里,走訪了大概十幾家中國紡織服裝面料企業(yè),包括幾個國際大牌在中國最大的代工廠。
“中國可能能數(shù)上前三的最大的服裝面料生產企業(yè)出口商,在它的其中一個產品線上,有28個人類設計師。這28個人類設計師,每天需要完成4個完全不同的全新的畫面和紋樣的創(chuàng)意。”徐元春說,這樣的任務量對于設計師來說是巨大的挑戰(zhàn),創(chuàng)造力會被不斷的壓榨。而微軟小冰可以有效的解決這個瓶頸。
徐元春介紹小冰在設計領域的落地
據(jù)了解,微軟小冰和中國紡織工業(yè)聯(lián)合會,以及幾家最大的紡織面料企業(yè),聯(lián)合開發(fā)了一個紡織服裝設計平臺。在這個平臺上,不僅可以生成像繪畫圖案,也可以支持幾十種目前非常流行的紋樣和插畫的設計。
“微軟不會只想做一個行為藝術,不過小冰的商業(yè)化探索比較謹慎,我們不會上來就先以商業(yè)化落地為目標來決定我們是否開發(fā)這個項目。”李笛說。
據(jù)微軟方面介紹,微軟最早的商業(yè)化探索始于兩年前,和日本羅森便利店合作的一些零售的商業(yè)化探索。而微軟預想的商業(yè)化輪廓,一直都很清晰,在某一個垂直領域的生成,一定是具有商業(yè)價值,從視覺生成到文本生成,小冰一直在探索。
對于小冰的技術落地,人工智能的成熟度等問題,鋅財經對話了微軟(亞洲)互聯(lián)網(wǎng)工程院副院長(Bing中國及日本、微軟小冰全球產品線負責人)李笛和微軟(亞洲)互聯(lián)網(wǎng)工程院、微軟小冰人工智能創(chuàng)造及商業(yè)事業(yè)部總經理徐元春。
鋅財經
今天主要發(fā)布了小冰在畫畫領域的技能,不管是哪個領域的創(chuàng)作,都是以人類為目標,盡量讓小冰的創(chuàng)作更接近人類的水平,這項技術接下來還有什么樣的潛力,還能應用在哪些領域?
李笛
人工智能創(chuàng)造最重要的核心部分,其實是統(tǒng)一的創(chuàng)作模型,我們今天應用到了詩歌,音樂,還有視覺,不停地驗證這個創(chuàng)作模型存在的意義。
在這個基礎之上,它的價值在于學習速度非常快,我們今天主要是用音樂的方面來表現(xiàn)她的成長速度,我們可以看到短時間內有很大的成長空間。而人類在學習的時候,一旦遇到瓶頸,很難突破,但小冰不一樣,可以打回去重學,不斷成長,而人類有時候會有一些局限。所以,不管是在哪個領域,人工智能都是很有希望的。
鋅財經
從專業(yè)的角度看,現(xiàn)在AI創(chuàng)作的技術成熟度達到了什么水平?
李笛
不同類別不太一樣,以小冰繪畫來講,人工智能和人類在學習水平上,有非常顯著的不同。比方說小冰的創(chuàng)作質量好,其實很大程度上是因為她的精度,人類畫在畫布上沒有精度的問題,但是在訓練模型上有精度的問題,每次讓她的精度提高,看起來她的畫作質量水平也就提高了。
鋅財經
現(xiàn)在小冰可以寫萬得資訊的摘要,作畫等,用人工智能相關技術完成的工作,跟人類創(chuàng)造者有哪些不同,小冰有什么優(yōu)勢和劣勢?對于機構而言,小冰如何達到質量方面的要求,判定標準是什么?
李笛
機構的判定標準,我們可以以萬得咨詢的26類為例,人工智能系統(tǒng)的很大特點不是超過人類創(chuàng)作者。這個固然也有無可奈何的一面,因為涉及到創(chuàng)造領域,人類的標準從來都沒有確定過——類似圍棋一樣的確定標準,誰都賴不掉——但人類在創(chuàng)造領域的時候,標準本身就是很主觀的。
所以我們不認為人工智能可以勝過人類,但對于人類有啟發(fā),像寫詩、畫畫這類對人類創(chuàng)造者有啟發(fā),這是普遍存在的,但是標準上它不可能超過人類,這是一個從根源上不可能實現(xiàn)的一件事。
但相對人類來講人工智能的優(yōu)勢到底在哪?就是它在和人類某種級別的創(chuàng)造者的水準差不多的情況下,比人類快、比人類穩(wěn)定、比人類的效率高,比人類持續(xù)時間長,還有就是可以同時和很多人并發(fā)的效果,是遠非人類可以比擬的。
舉一個例子,有一個新聞主持人,在節(jié)目直播主持過程中,想了解一下觀眾對于這個新聞的反應,然后根據(jù)反應去實時地調整接下來要說的情況,人類主持人是做不到的,就算后面有一整個導播團隊,也是不夠的。
但小冰不是,如果觀眾需要,小冰在屏幕上主持這個節(jié)目的時候,它可以迅速地去了解每一個觀眾當下對新聞的一些觀點和評論,然后馬上就可以根據(jù)這個反饋,在節(jié)目里進行調整。
徐元春
在相對嚴肅的組織機構里面,其實標準的嚴格程度甚至超過我們現(xiàn)在的想象。舉例來講,正常情況人類寫今日公告摘要,最快要用半個小時,而機器在做這件事情的時候,平均大概在10-20秒內就完成了,而且可以高效率的完成。
機構會怎么采用技術呢?在最開始的時候,機器生成完之后,再讓人類編輯檢查一遍有沒有問題,這是沒有上線的時候,這種狀況運行了大概3個月的時間。
然后人力和機器并行運行的階段,比較兩個團隊穩(wěn)定性輸出的水平,直到6個月之后,覺得機器運行已經遠遠高于本身人力編輯團隊運行的狀況了,就把系統(tǒng)慢慢地切換到了機器的系統(tǒng)上。
鋅財經
發(fā)布會上提到,人們對于人工智能生產的內容,會有一定的偏見,人工智能商業(yè)化的一個障礙是人類的想法本身嗎?另外,團隊希望之后小冰反過來去指導繪畫,那如何能讓用戶去使用這種人工智能的產物呢?
李笛
我們認為人類在人工智能創(chuàng)造上的偏見很明確,因為我們現(xiàn)在做的這個產業(yè)化工作比較多,很明顯就是在兩類上:
第一類:明確涉及到藝術門類的,它是藝術而不是內容產業(yè)。如果反過來不是說內容產業(yè)而是說藝術門類,那么人類的偏見是存在的,為了解決這個問題我們所做的事情是比較粗暴的,就是化名,就是讓人沒有這個先入為主的可能性。
第二類:供需關系上供已經大于求了,這件事情人類做本來就已經足夠了,我們不做,因為人類做的已經很好了。換句話說,今天如果純手工生產的景德鎮(zhèn)的陶瓷已經足夠滿足全世界人們所需要的瓷器了,沒有人會想要工業(yè)化的瓷器。
除此之外的類別沒有偏見,舉個例子,比方說家長通過微軟小冰給自己的孩子生成大量的孩子做主人公的兒童有聲讀物,除了用小冰這種方式之外沒有其它途徑。所以,一個是明確是藝術門類的,我們的解決方法是用化名,還有一個是明確這個地方是供大于求的,這個我們就不做了。
?本文版權歸“鋅財經”所有
- 世間將再無松下電視:松下官宣解散家電子公司并徹底放棄電視機業(yè)務
- 雅迪集團與南都電源簽署協(xié)議:攜手共繪固態(tài)電池未來藍圖
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領先技術與深度整合是關鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關注
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。