第四范式創(chuàng)始人兼 CEO 戴文淵表示:「C 端產品已經逼近用戶體驗的上限,而 B 端的企業(yè)級軟件往往是個十分復雜的執(zhí)行系統,堆砌十幾層菜單和成千上萬功能也不算多。」
戴文淵認為,目前這些 B 端軟件極為復雜的交互體驗,以及復雜性帶來的極低開發(fā)效率,恰恰為生成式 AI 留下足夠大的重構和改造空間。
「過去很難通過人類語言(自然語言)的方式去調用企業(yè)軟件的功能,現在當我們有更強的語義理解和生成能力,再加上 GPT 任務翻譯、任務分發(fā)和推理的能力,就可以通過更好的「對話框式」交互方式實現功能的調用,不再需要找到某個位于十幾級的菜單目錄之下的功能?!?/p>
這背后還是大模型的能力。第四范式現場拔網線,展示了式說大模型的圖片理解、多輪對話、寫小說、迅速畫圖等能力。
基礎能力 demo
此外,現場展示了式說通過推理能力完成更加復雜的「裝箱」操作,以及其現場編寫代碼的能力。
裝箱和寫代碼 demo
在戴文淵看來,要做到 AIGS,大模型未必需要是知識廣博、十項全能冠軍的通才,更重要的在于模型具備 Copilot(副駕艙),和思維鏈 CoT(chain of thoughts,多步推理)的能力。
「要去改造企業(yè)軟件,大模型不能只有語言能力。式說 2.0 就加入了多模態(tài)和 Copilot,因為很多企業(yè)軟件里的數據是多模態(tài)的,而 Copilot 能把人的指令翻譯成要調用后臺的哪個 API?!勾饲鞍l(fā)布的式說 2.0 的 Demo 中,門店員工通過語音、文本等交互方式向式說發(fā)起指令,式說理解后,聯網門店監(jiān)控軟件調出后廚未戴口罩的圖片,并直接將圖片以對話框的形式輸出給員工。
大模型去調用軟件內置的一個個功能、數據來「對話框式」完成任務,已經能產生巨大價值。但員工用企業(yè)軟件時也會面臨復雜任務,需要人按照順序執(zhí)行一個個功能。
因此,式說 3.0 強調的是 Copilot 加上思維鏈 CoT,具有更強的推理能力,在學習大量數據和「攻略」后,能形成中間的邏輯推理步驟,從而做到拆分并執(zhí)行復雜工作。
第四范式將 AIGS 的路徑總結為三個階段:
第一階段,Copilot 調動不同的信息、數據、應用,作為助手完成用戶的指令。相當于在所有企業(yè)級軟件系統里,配備一個指揮官。指揮官聽用戶的指揮,比如「把照片亮度調亮 20%」。
第二階段,Copilot+基于企業(yè)規(guī)則的「知識庫」,AI 能夠參照規(guī)則做復雜工作,進一步豐富了「對話框」的能力。比如 AI 查詢了「人像美化」知識庫后,能執(zhí)行把照片修好看的步驟。
第三階段,Copilot+CoT(思維鏈)。軟件系統的使用行為最終會被大模型學會,形成 AI 針對這個領域的思維鏈,意味著「把照片處理得更好看」這種復雜指令,AI 能自動地按照步驟完成。
第四范式的 AIGS 戰(zhàn)略,就是指基于式說大模型背后的 Copilot+COT 能力,把企業(yè)軟件改造成新型的交互范式,并在新型交互上不斷地學習軟件的使用過程,形成領域軟件的「思維鏈」。
在我國航空制造代表企業(yè)的實際場景演示中,其與第四范式基于 Copilot 技術,聯手改造了某工業(yè)設計軟件。
零件搜索和裝配 demo
現場某醫(yī)療行業(yè)的實際場景演示中,式說的「思維鏈」能夠清晰指出將藥品銷售出去的具體步驟。
醫(yī)藥代表賦能 demo
最終,由于新的交互形式的出現,企業(yè)軟件的開發(fā)效率變得更高。以前是功能和執(zhí)行邏輯被編排在軟件界面,每次一個功能升級,都要周而復始的經歷原型圖、設計、開發(fā)等,至少是月級別的開發(fā)時間。而現在由于「對話框式」的界面是固定的,功能和邏輯被改寫在數據、API 和內容層面,變成了天級別的開發(fā)效率。
值得一提的是,在式說 3.0 發(fā)布現場,來自航空制造、金融、醫(yī)療等行業(yè)的客戶代表出席并做產品的 live demo 演示。ChatGPT 出現的短短兩個月內,眾多企業(yè)與合作伙伴已經與范式在生成式 AI 方面開展了深度合作。式說作為基于大模型的新型開發(fā)平臺,期待與更多合作伙伴與企業(yè)客戶及一起,探索以生成式 AI 重構企業(yè)軟件的機會,共同提升企業(yè)軟件的易用性和生產力。
- 第四范式AIGS戰(zhàn)略背景材料
關于大模型:
1、第四范式什么時候開始關注投入 GPT和大模型:
在 BERT 出來的時候,范式研究院就開始關注并投入在這個技術領域,GPT3 出來以后更加明確了要朝這個方向。不過相比今年的投入,過去幾年肯定還是有差距的。ChatGPT 對我們最大的幫助,就是整個市場的信心一下從 0 調滿了,確定性的投入更大了,再往后就是變成產品、變成商業(yè)化的路線往市場去推。
2、是否跟同行做過對比?
中國目前還沒有像 OpenAI 那樣在大模型上絕對領先的公司,也會有更多的大模型。大模型是新的生產力,大家都得有大模型作為底座,所以入局的門檻確實是變高了。
但是在達到這個門檻之后,重點在于如何選擇方向。比如培養(yǎng)了一個大學生后,到公司再接受專業(yè)的訓練,在某一個領域積累專業(yè)的能力,這是很重要的。但不具備一定的素質有很多事就干不了,所以底層的大模型也很重要。
第四范式認為比較大的機會在于改造整個的企業(yè)軟件行業(yè),也就是 AIGS 這個方向。發(fā)力的大模型技術方向是 Copilot 可控(執(zhí)行可控、知錯能改),和思維鏈 COT((chain of thoughts,多步推理、復雜任務拆分)的能力,形成數據飛輪(比如將某垂直領域的數據和流程投入大模型,很快可以形成模型在該領域的思維鏈)。
3、式說在短短兩個月的時間已經發(fā)布了 3 個版本,從 1.0-3.0這中間的迭代過程是?
1.0——ChatGPT 火了之后,大部分的客戶和伙伴還沒有真的使用上 GPT 類似的技術,我們當時出了第一代的產品。式說 1.0 有生成語言的能力,并且解決 GPT 技術應用時內容可信、數據安全和成本的三大問題。當時主要的場景就是文庫問答,相當于讓 GPT 學習的企業(yè)知識后,可以解答專業(yè)問題,并且是可溯源的。
2.0——在式說語言能力基礎上,加入了文本、語音、圖像、表格、視頻等多模態(tài)輸入及輸出能力,并增加了企業(yè)級 Copilot 能力。以與企業(yè)內部應用庫、企業(yè)私有數據等進行聯網,對信息和數據進行分析,回答員工的問詢或執(zhí)行相關任務,從知識助手成為業(yè)務助手。
3.0——在生成式和語言能力的基礎之上,3.0 發(fā)力 Copilot 和思維鏈 COT(多步推理、復雜任務拆分、形成數據飛輪),改造傳統 B 端企業(yè)軟件的體驗與開發(fā)效率,我們叫 AIGS(AI generated software),以生成式 AI 重構企業(yè)軟件。
關于 AIGS:
4、為什么想到做 AIGS(software)?什么是 AIGS?
C 端的軟件體驗在過去的十幾年已經被打磨到了比較高的水準,你用對話未必就一定更好用。但是 B 端(想象一下在企業(yè)報銷系統、HR 系統、OA 系統),體驗還是比較差的。可能你在菜單里面點一個下拉菜單,再點下拉菜單,再點幾下才能進入到某一個功能。
過去很難通過自然語言的方式去調用這些功能,現在當我們有更強的語義理解的自然語言的時候,可以通過更好的交互方式去實現功能的調用,從而實現用新型的通過語音/對話的交互模式,去替代老的交互,從而使 B 端企業(yè)軟件的體驗迅速一個顛覆式的提升。
其次是開發(fā)效率的提升。原先 B 端企業(yè)軟件都是高度定制化的,基于菜單式的開發(fā),基本每次一個功能升級,又要產品經理畫界面,設計、開發(fā)等,至少是月級別的開發(fā)時間。而由于新的交互形式的出現,以前是功能和執(zhí)行邏輯被編排在軟件界面,現在功能和邏輯被改寫在數據、API 和內容層面,變成了天級別的開發(fā)效率。
就像 ChatGPT 不再是一個復雜的菜單和一堆的功能,只需要一個對話框就能做很多事情。并且它背后每天都在迭代,但你感受不到它的界面發(fā)生了什么變化。以前軟件是在界面層面的升級,未來是在數據層面的升級。
我們看到大模型能夠帶來用戶體驗的提升,開發(fā)效率的提升,所以一定會形成軟件行業(yè)的飛躍,就是誰率先能做出來的問題。這是一個巨大的市場。大模型是新的生產力,以大模型基礎設施為先導項目,改造整個軟件產業(yè),整個行業(yè)的業(yè)務價值、商業(yè)模式都會得到飛躍。
5、式說如何能實現 AIGS?
去改造軟件大模型不能只有語言能力。式說 2.0 就加入了多模態(tài)和 Copilot,因為很多企業(yè)軟件里的數據是多模態(tài)的,而 Copilot 支持用對話去調用軟件內置的一個個功能/數據來完成任務。2.0 的時候,員工可以通過語音、圖像、表格、視頻等多模態(tài)方式向式說發(fā)起詢問或下達指令,式說理解之后,聯網企業(yè)軟件調出有關功能,并以所需要的形式輸出答案。
我們去完成任務的時候,往往不完全是一個功能。比如說圖像處理軟件,如果你要調亮度、對比度,這是功能。但如果是將人物 P 瘦一點,它就不是一個單一功能能實現的了。這背后需要人按照經驗,執(zhí)行軟件的一個個的功能才能實現。
人接收到復雜的工作,會在大腦里推理出一步步要執(zhí)行的子任務,然后再按步驟去執(zhí)行。換成機器,如果對于同一個工作,機器在過去見到過足夠多的人(累積數據)通過一二三四步把這個工作完成了,它已經可以這個套路總結出來,就形成了思維鏈。
所以式說 3.0 強調的是 Copilot 加思維鏈 CoT。大模型用更強的 CoT 推理能力,去不斷學習新領域的思維鏈,相當于用軟件本身的使用行為,去構建 AI 針對這個領域的思維方式。
對于企業(yè)軟件合作伙伴來說,可以基于范式的大模型能力,在一個個領域里面鉆的足夠深,學習到足夠多的數據,最終所形成領域的思維鏈,發(fā)展成「領域」大模型。當思維鏈復雜度到一定程度以后,它的軟件就能夠自動執(zhí)行越來越復雜的功能。
6、過去范式做的事對此有什么積累?
首先,范式擁有做大模型的技術能力。雖然先知不是做通用模型的定位,當時定位是做專用模型,但先知一直強調模型是要高維的,所謂的高維其實就是參數,要把模型做大,就像 GPT3.5 是 1700 多億的參數,這是從技術上來說能平移過去的地方。此外范式擁有國內領先的研究院、工程化、產品力的全棧技術能力。
其次,范式原有市場和新市場所面對的產業(yè)鏈正好是上下游。以前 AI 更像是一種重要零件或者元器件,這些以外的其他地方不是 AI 覆蓋,是企業(yè)軟件覆蓋。企業(yè)軟件經過了這么多年發(fā)展,基本上能把所有的事都覆蓋了。范式和軟件公司一直互為生態(tài),范式做的是軟件里面的 AI 決策,軟件公司做功能和流程的實現。比如 AI 預測出門店明天要運多少雞翅,這需要放到門店管理的系統里。
我們互相共生也很了解,看到 GPT3 時已經知道了,是可以幫助到企業(yè)軟件市場的。做這個事情還是需要非常強的一個行業(yè)積累,第四范式過去幾年在行業(yè)里面扎得還是比較深的,我們對 AI 產業(yè)化的深層次理解,更清楚明白大模型作為新生的生產力工具,如何落地才能產生最大的價值。
來源:極客公園 (侵刪)