AI也會作畫!微軟用GAN搭配拆解單詞模仿人類作畫(2)
分类:新酷科技 热度:

若是由人類來作畫,我們會不斷的留意且確認每個單詞的形容,來對應到作畫的區域,簡單來說,給予普通人一個作畫的形容,比方說畫出黃色的身體、黑色翅膀和短喙的鳥,大局部的人會先描繪出鳥的輪廓,再从新看一次文字形容,看到要畫黃色的身體才去找黃色的筆來塗滿鳥的身軀,再看一次形容,拿起黑色的筆開始畫翅膀,持續這樣的步驟來來回回,最後確認畫出的圖像與形容相符。

為了要擷取人類這項作畫的特徵,钻研人員創造了一套名為attentional GAN或是AttnGAN的神經網路,藉由將文字形容拆解為個別的單詞,並將這些詞與作畫的區域相互配對,來實現模擬人類作畫的行為,也就是在訓練AI產生圖像時,聚焦於個別的單詞,像是類似標題的文字形容,如此一來,相較於傳統的文字轉圖像办法,此办法所產生的圖像品質晋升了3倍。「留意力是人類的概念,我們用數學將留意力變成可運算的。」 Xiaodong He說。

AttnGAN還能從訓練資料中學習人類的常識,將這樣的知識萃取出來後,填補文字形容中短少的圖像細節,舉例來說,因為許多在訓練資料中的鳥類圖片都是鳥坐在樹枝上,因而,AttnGAN產生的圖像,也幾乎都是鳥在坐在樹枝上的圖像。

從資料中,機器學習演算法學習到通常鳥類都會在哪裡的常識,為了測試,團隊給予作畫機器人一些非失常的標題,像是一臺紅色的雙層巴士浮在湖上,作畫機器人產生了一張模糊潮濕的圖像,圖像中蕴含了一艘船和一臺雙層巴士浮在湖上,周圍被山包圍,這樣的圖像展现了,作畫機器人在產生文字形容的圖像和常識中,有點掙扎。

Xiaodong He示意,钻研員能夠管制形容和機器的反應,因而能夠測試機器學習到了什麼,他們認為,機器學習到了一些背景知識,也就是常識,不過,還是得根據不同的形容情況而定,有時候作畫機器人產生的圖像也會不太正当。

未來,作畫機器人的文字轉圖像技術能够協助畫家素描,或是協助室內設計師,這項技術也能够成為調整有聲圖片的工具,藉由更多的運算才能,微軟認為這項文字轉圖像技術能夠透過劇本產生動畫,減少一些需求人工處理的局部工作。

微軟示意,現在這項科技還不夠完满,仔細的檢查圖像還是會發現缺点,像是鳥喙是藍色而不是黑色,水果也會出現突變的香蕉,這些缺点明顯是電腦作畫才會犯的錯誤,然而,若要人類和AI共存在同一個世界中,我們必須找到一個办法互動,語言和影像是2個人類與機器互動最重要的模式。

上一篇:內神通外鬼! 駭客與俄國加油站員工聯手以惡意程 下一篇:Spectre修補程式引發效能大災難,Red Hat乾脆撤回,
猜你喜欢
各种观点
热门排行
精彩图文