
這是阿里大模型 " 通義千問 " 給的回答,你覺得怎么樣?
ChatGPT 發(fā)布后,數(shù)月間全世界都對 AI 的能力有了新的認知 。科幻小說正在變?yōu)楝F(xiàn)實,既然我們人類早晚要跟 AI 共存,不如先用通義千問做個測試,AI 到底是生活伴侶還是生產(chǎn)助手?更擅長提供情緒價值還是工具價值?
至于我們的結論,hmm,往下看就知道了 。
許多 AI 測試文章中,提問者都會先讓 AI 自我介紹一下,我們決定玩點不一樣的,讓文心一言如何評價通義千問 。
我首先問的:" 評價一下通義千問 ",文心一言則給出了以下的回答:
有意思,文心一言直接把通義千問與 ChatGPT 弄混了 。
將問題修改為 " 介紹一下阿里巴巴推出的通義千問 " 后 , 文心一言終于讀懂題了:
用相同的格式提問,通義千問是這么介紹一下文心一言的:
雖然回答十分簡短,但是沒有把研發(fā)者弄混,比文心一言的表現(xiàn)要好 。
單從現(xiàn)在的測試結果來看,通義千問至少在對簡短提問的信息檢索正確率上要比文心一言更高 。
接下來讓我們給通義千問上點難度 。
對于一般人而言 , 在面對 " 吃西瓜為什么不吐葡萄皮?" 這樣的腦筋急轉彎時,很快就會意識到其中的常識性錯誤,并指出其中的邏輯問題 , 那么通義千問又會如何回答?
似乎沒有難住它,第一句就指明了西瓜和葡萄是不同的食物,在常識性上沒有出現(xiàn)問題 。不過后續(xù)的解釋似乎又將西瓜和葡萄的關系進行了一定的混淆,最后給出的結論也有一些小瑕疵 。看來言多必失?。⊥ㄒ邇?nbsp;, 要不你還是少說點?
這個問題我也同樣問過文心一言:
首先,西瓜是葫蘆科 ... 其次,我想沒有人在吃西瓜時會不切開直接咬下果肉吧?顯然文心一言對邏輯性、常識性錯誤的誘導式問題處理還是存在不少問題,它并沒有意識到人類正在有意 " 欺騙 " 自己,而是根據(jù)提問開始收集相關信息 , 并依照數(shù)據(jù)模型將信息強行拼合在一起,最終給出一份奇怪的回答 。
在后續(xù)的幾個普通提問中,我發(fā)現(xiàn)通義千問偶爾會出現(xiàn)一些奇怪的小 BUG,比如將相同的回答重復一遍,這極強的表現(xiàn)欲,你看像不像個話癆小朋友 。
下一題,出道哲學題考考通義千問:
說實話,比我對生活的理解都要更加深刻 。就是……有點啰唆,有些話翻來覆去重復表達,還說得飛快,我真的是趕不上它瘋狂輸出的那個藍色小光標 。
再來考考它的情商 。當我告訴通義千問我很傷心:
挺積極向上的安慰 , 就是沒啥用,我并不指望它說的話能真的安慰我,在面對困境卻沒有人傾訴時,它在我身邊,陪我說說話就好 。
當我告訴它我戀愛了,馬上就要結婚了,它的表現(xiàn)像極了一個熱情滿滿、同時頭腦精明的情感分析師婚禮策劃師 。
回答得不錯,給出的建議都很實用,只是人情味似乎少了點," 賣貨 " 來得早了點,然后我就按下對話界面右下角的 " 停止生成 " 按鈕 , 讓它閉嘴了 。
收藏夾不要放在系統(tǒng)盤,以免忘了備份,每次裝完系統(tǒng)用超級魔法兔子“指 定路徑
不過,接下來的測試 , 讓我堅信,通義千問很有成為情感博主的潛質,因為它真的絮絮叨叨的 。
我每次和它談到情感類問題,它會忍不住長篇大論,給人一種 " 你也喜歡八卦啊 " 的感覺 。比如我詢問它如何向喜歡的女孩告白時,他就洋洋灑灑寫下數(shù)千字幫我出謀劃策 。AI 狗頭軍師,你值得擁有 。(驕傲臉 .jpg)
鑒于篇幅問題 , 就不放上所有截圖了,因為它的話實在太多了 。有興趣的朋友可以等通義千問公測后去試一試 , 說不定能夠結束你單身多年的生活,當然前提是要你不嫌它煩 。
手動原地排氣自潔步驟 , 顆粒捕集器正在自潔要多久手動原地排氣自潔步驟 汽油車: 1、把車輛停放在平坦空曠的室外 , 禁止在地下車庫或室內進行操作; 2、啟動發(fā)動機,拉起手剎并把擋位 。
常識類、情感類的問題看樣子難不倒通義千問,那么文學賞析呢?
不得不說,詩句和文學賞析的回答十分到位,甚至做了意象描述 , 被它(裝逼)裝到了 。
如果通義千問有繪圖功能 , 我絲毫不懷疑它會現(xiàn)場給我畫一副描述 " 空山新雨后 " 的畫作出來,畢竟它真的很愛表現(xiàn)自己 。
實際上,當我把這個作圖需求下給達摩院文生圖大模型(我理解是通義千問的同胞兄弟姊妹)后,它給我生成了一副符合描述的照片 。
在近期的一次訪談中,達摩院的相關負責人表示技術上其實不存在問題,只是需要進行一些軟件工程上的處理就可以完成 。看來之后就能看到通義千問圖文并茂地表達了,有點期待呢,畢竟以后就可以讓它多畫圖、少說話了 。
上面的一系列測試,主要是圍繞生活 / 娛樂場景展開的,都是針對通義千問在常識、知識等方面的測試,那么在生產(chǎn)力方面 , 它的表現(xiàn)又如何呢?
ChatGPT 在生產(chǎn)力上的表現(xiàn)不僅帶來了一輪新的生產(chǎn)力革命,也讓不少人擔心自己會被 AI 取代 。作為與 ChatGPT 類似的 AI 大模型 , 通義千問在生產(chǎn)力方面的表現(xiàn)怎么樣呢?
1、寫劇本
雖然從劇情來說并不算驚艷,但是也有著開幕、挫折、高潮、結尾等結構,算是一個完整的故事 。
2、寫腳本
有些簡單了,但是通義千問顯然已經(jīng)具備根據(jù)要求生成對應劇本和腳本的能力 。
【swot戀愛分析報告 戀愛情感分析報告】3、寫提綱
從專業(yè)編輯的角度來看,這份提綱有著很高的可操作性,沿著這個提綱的思路撰寫文章 , 足以給出一篇完善且具有深度的行業(yè)報告 。
用它來輔助工作,似乎還不錯 。而且它不僅懂中文,還懂英文、法語 。按照它自己的說法,它一共掌握了 17 種語言 。我沒有進行一一測試(它的聒噪已經(jīng)給我留下陰影),后續(xù)有機會參與測試的朋友 , 倒是不妨體驗一下 。
我讓通義千問幫我寫一份給美國女孩蘇西的信,內容是介紹中國,這里我就直接放翻譯吧:
從測試來看,只要提供足夠的信息,通義千問就能寫 。
4、SWOT 分析
做市場分析的朋友,對這個應該都不陌生 。
作為一個對手機市場十分了解的科技數(shù)碼編輯 , 我對通義千問的這篇分析看法是認可的,除了少數(shù)的小問題,我沒有挑出其他的毛病了 , 甚至能夠以此為基礎,擴寫一份詳盡的報告出來 。行吧,給它點個贊吧 。
從實際表現(xiàn)來看,通義千問與領先的 GPT 4.0 還有很大的差距,但是對比此前的一些 AI 大模型 , 通義千問在問答邏輯、信息檢索、語句理解等方面都已經(jīng)有了明顯的進步,我現(xiàn)在對中國 AI 大模型的未來充滿了信心 。
而且,國內最大的 AI 模型社區(qū)魔搭也是由達摩院牽頭創(chuàng)建并維護 , 企業(yè)和個人都可以更加輕松地訓練和調整自己的 AI 大模型,阿里也在開放一些 AI 大模型供企業(yè)和個人使用,通義千問擁有目前的水平或許就是大家一起努力的結果 。
世界正在改變 , 一個全新的 AI 時代正在到來,你見或者不見,大語言模型的能力就在那里 , 不來不去,關鍵在于怎么用它 。如果你擁有 " 通義千問 ",你會怎么用它呢?歡迎評論區(qū)留言 。
村里不走單口人:有一個村莊 , 老輩子傳下來一種說法:村里不走單口人 。走就是死的意思,當?shù)仫L俗,人死不說死,說走 。一年里頭 , 小村里要么不走人,要么就走兩個 。據(jù)年紀最大的趙六爺和錢七爺回憶打他們記事起就如此 。再往上查,他們的父親和爺爺也都這么說 。盡管有人不相...
猜你喜歡
- 戀愛數(shù)據(jù)分析報告 戀愛情感分析報告
- 戀愛調查分析報告 戀愛情感分析報告
- 1000個情感故事
- 完成自己創(chuàng)業(yè)項目的swot分析,創(chuàng)業(yè)swot分析案例范文優(yōu)勢劣勢
- 離婚訴訟期間戀愛算出軌嗎 離婚訴訟期間算出軌嗎
- 怎么認定感情破裂離婚 怎么認定感情破裂
- 創(chuàng)業(yè)困境問卷調查報告,創(chuàng)業(yè)項目調查問卷分析報告
- 《理智與情感》英文名
- 離婚分居期間可以談戀愛嗎 分居期間可以談戀愛嗎
- 分居期間可以出軌嗎 分居期間戀愛算出軌嗎
