視點(diǎn) 發(fā)自 凹非寺 量子位 | 公眾號(hào) QbitAI
今天,盡管人人都在談?wù)摯髷?shù)據(jù),但數(shù)據(jù)實(shí)際價(jià)值和現(xiàn)有價(jià)值有巨大落差。
(相關(guān)資料圖)
盡管企業(yè)采集和儲(chǔ)存、計(jì)算數(shù)據(jù)的能力越來越強(qiáng),但數(shù)據(jù)分析能力始終增長(zhǎng)緩慢。據(jù)Forrester調(diào)研,約70%的企業(yè)數(shù)據(jù)從未被分析和使用過,成為 數(shù)據(jù)釋放價(jià)值 過程中的卡脖子難題。
過去二十年,世界從PC時(shí)代走進(jìn)移動(dòng)時(shí)代又走到AI時(shí)代,生產(chǎn)力工具越來越簡(jiǎn)單易用,但數(shù)據(jù)分析的方式始終沒有本質(zhì)區(qū)別,高使用門檻將企業(yè)中的大量數(shù)據(jù)消費(fèi)者 (非技術(shù)背景的業(yè)務(wù)人員) 拒之門外。
站在 AIGC時(shí)代 的門口,下一個(gè)十年,人們應(yīng)該如何與數(shù)據(jù)對(duì)話?以ChatGPT大語言模型為代表的自然語言人機(jī)交互方式,將如何改變我們的工作方式?企業(yè)又如何把握這場(chǎng)技術(shù)變革浪潮,充分釋放數(shù)據(jù)的價(jià)值,驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)?
圍繞 AIGC將如何影響數(shù)據(jù)分析,從而為企業(yè)帶來價(jià)值 , 北極九章創(chuàng)始人兼CEO劉沂鑫 在「量子位·視點(diǎn)」直播中分享了他的從業(yè)經(jīng)驗(yàn)和觀點(diǎn)。
以下根據(jù)分享內(nèi)容進(jìn)行整理:
數(shù)據(jù)分析或商業(yè)智能是件非常古老的事情,跟AI差不多,都是1960年代開始在美國(guó)興起。我今天分享的主題是,這個(gè)非常具有時(shí)代感的事情,怎么在一個(gè)新的AIGC時(shí)代,通過新技術(shù)煥發(fā)出不一樣的生機(jī)。
先問大家三個(gè)很簡(jiǎn)單的問題:
第一,在你的企業(yè)當(dāng)中,你覺得數(shù)據(jù)驅(qū)動(dòng)這件事情到底重不重要?
第二,我的公司或者我的工作,是不是靠數(shù)據(jù)驅(qū)動(dòng)決策?
如果前兩個(gè)問題的答案都是yes的話,最后一個(gè)問題更直擊人心:我們投入了這么多的資源,看了這么多的數(shù)據(jù),它創(chuàng)造了多少價(jià)值?有多少產(chǎn)出?ROI是多少?
這三個(gè)問題的核心在于,我們說了這么多年要靠數(shù)據(jù)來驅(qū)動(dòng)業(yè)務(wù)發(fā)展,那到底數(shù)據(jù)真正能為我們的企業(yè)帶來多大的價(jià)值?
哈佛商業(yè)評(píng)論在2022年對(duì)全球最領(lǐng)先企業(yè)的采訪中發(fā)現(xiàn),只有26.5%的企業(yè)認(rèn)為自己實(shí)現(xiàn)了數(shù)據(jù)驅(qū)動(dòng)。MIT的調(diào)研發(fā)現(xiàn),只有8%的企業(yè)真正利用數(shù)據(jù)提升了利潤(rùn)。
我們發(fā)現(xiàn),過去50年的時(shí)間,即使是全球最領(lǐng)先的企業(yè),數(shù)字化轉(zhuǎn)型帶來的利潤(rùn)只有這么少。在國(guó)內(nèi),大家做了很多數(shù)據(jù)中臺(tái)、數(shù)據(jù)治理和數(shù)據(jù)準(zhǔn)備工作,但沒有通過數(shù)據(jù)讓企業(yè)賺到錢。為什么?
我在美國(guó)工作的時(shí)候,服務(wù)世界頂級(jí)的銀行,發(fā)現(xiàn)美國(guó)企業(yè)從上世紀(jì)90年開始應(yīng)用數(shù)據(jù)的方式方法已經(jīng)發(fā)生了變化,原因在于美國(guó)經(jīng)濟(jì)從90年開始年增長(zhǎng)率就在大約3%,當(dāng)經(jīng)濟(jì)增長(zhǎng)放緩,企業(yè)更看重的是精細(xì)運(yùn)營(yíng)帶來的數(shù)據(jù)驅(qū)動(dòng),從而迅速響應(yīng)市場(chǎng)的變化。
麥肯錫在2022年1月份發(fā)布的報(bào)告《2025年做一個(gè)數(shù)據(jù)驅(qū)動(dòng)的企業(yè)》指出,在2025年,企業(yè)里的每一個(gè)員工都會(huì)習(xí)慣于使用數(shù)據(jù)來支撐自己的工作,他們會(huì)使用創(chuàng)新的數(shù)據(jù)工具,在短時(shí)間內(nèi)通過數(shù)據(jù)來解決工作當(dāng)中的問題。基于此,領(lǐng)先的企業(yè)在2025年通過全新的數(shù)據(jù)使用方式,CIO以及數(shù)據(jù)團(tuán)隊(duì)將會(huì)從成本部門轉(zhuǎn)變成為利潤(rùn)部門。
但一個(gè)實(shí)際情況是,在疫情之前,中國(guó)的經(jīng)濟(jì)以每年約10%的速度增長(zhǎng),企業(yè)只要產(chǎn)品可以生產(chǎn)出來,一定可以賣得出去。所以企業(yè)經(jīng)營(yíng)只要靠經(jīng)驗(yàn)來判斷就可以了,數(shù)據(jù)分析只起到統(tǒng)計(jì)作用。企業(yè)有平均70%數(shù)據(jù)從未被分析和使用過。我在跟一個(gè)中國(guó)領(lǐng)先的汽車企業(yè)客戶交流時(shí),他們給我們反饋是大概80%~90%的數(shù)據(jù)只是存儲(chǔ),從來沒有被使用過。所以我們也一直在思考,怎么樣可以更好地使用和分析數(shù)據(jù),把70%到甚至80%的潛在價(jià)值發(fā)揮出來。
我們現(xiàn)在在企業(yè)里面怎么分析數(shù)據(jù)呢?
我要從100張看板當(dāng)中找到某一張看看關(guān)心的數(shù)據(jù),發(fā)現(xiàn)這個(gè)數(shù)看起來有點(diǎn)問題,就得去提交個(gè)工單,數(shù)據(jù)分析師或IT拉個(gè)看板或者導(dǎo)出個(gè)Excel表,再對(duì) Excel表進(jìn)行加工分析。可能到下個(gè)月我才知道這個(gè)數(shù)據(jù)的問題在哪里。如果我是賣服裝的,一個(gè)月后服裝就已經(jīng)過季了,數(shù)據(jù)沒了時(shí)效性就已經(jīng)失去了它的價(jià)值。
數(shù)據(jù)價(jià)值的鴻溝是怎么造成的?很大的原因是工具門檻過高。
2002年我們想獲取信息,我會(huì)去上新浪、搜狐、雅虎在滿屏的新聞里找我需要的內(nèi)容;到了今天我們會(huì)去Google、百度直接搜索,甚至抖音會(huì)自動(dòng)推薦我感興趣的。20年前我們用筆和紙素描,學(xué)攝影和P圖;但今天通過MidJourney、Stable Diffusion,我用一兩句話的描述,就可以生成非常專業(yè)的圖片。20年過去,這些工具變得極為簡(jiǎn)單。
回到數(shù)據(jù)分析,我們使用的工具和交互方式和20年前幾乎是一模一樣,我們可能花半年的時(shí)間學(xué)習(xí)一個(gè)復(fù)雜軟件,學(xué)會(huì)怎么樣分析數(shù)據(jù)、怎么樣配圖、怎么樣制作看板。
大家可以想一想,我們工作后會(huì)把多長(zhǎng)時(shí)間花在學(xué)習(xí)一個(gè)新技能上?數(shù)據(jù)分析本應(yīng)是很簡(jiǎn)單的事情,我每一天只需要看那么幾個(gè)數(shù)支持做決策就行了,但是我為了每一天看5分鐘,卻需要去花幾個(gè)月的時(shí)間學(xué)習(xí)非常復(fù)雜的工具。這造成一個(gè)很現(xiàn)實(shí)的問題,據(jù)埃森哲調(diào)查,75%的人人不愿意和數(shù)據(jù)打交道,36%的人在決策的時(shí)候會(huì)故意繞過數(shù)據(jù)。
在一個(gè)對(duì)話式AI時(shí)代,只要你能說,你就能做。我們可以大大降低數(shù)據(jù)門檻,提升大家的數(shù)據(jù)能力。
大家都知道GPT可以寫代碼,那么數(shù)據(jù)分析加大語言模型自動(dòng)寫SQL,作為我的Copilot,變成人和數(shù)據(jù)之間的翻譯器,可以嗎?
我們做了大量嘗試,發(fā)現(xiàn)GPT現(xiàn)階段還不能解決我們剛才提到的問題。我們首先要編寫一段prompt,雖然用的是自然語言,但你依然要按照計(jì)算機(jī)的方式去跟它交流,prompt越準(zhǔn)確,計(jì)算機(jī)才可以把它翻譯得越好。這導(dǎo)致的幾個(gè)問題在于:
第一是門檻高,用戶需要懂?dāng)?shù)據(jù),并且有分析思路;第二在于容錯(cuò)率低,需要一個(gè)足夠準(zhǔn)確、足夠完整的prompt,才能生成一個(gè)足夠精確的回答;第三它的套路固定,我們必須要讓每個(gè)用戶有結(jié)構(gòu)化的思維,才能有效引導(dǎo)機(jī)器來去理解人的意圖。所以這個(gè)prompt是有門檻的。
另外我們發(fā)現(xiàn)大模型生成的SQL語句,我問它同樣的問題每次代碼不一致,需要人工檢查,我如果不會(huì)寫SQL、不知道數(shù)據(jù)架構(gòu),這個(gè)代碼我是沒有辦法相信的。如果問題復(fù)雜了,它的錯(cuò)誤率會(huì)大大提高。另外,大語言模型沒有辦法去根據(jù)用戶的權(quán)限自動(dòng)生成代碼,而且它一次只能回答一個(gè)問題,新問題需要再去想另外一個(gè)新的prompt,一點(diǎn)一點(diǎn)構(gòu)造出我的SQL語句。
我們打開思路,是不是可以往前多走幾步,通過自然語言一步直接進(jìn)行數(shù)據(jù)洞察?北極九章給出了我們自己的解法。北極九章自研的核心技術(shù)生成穩(wěn)定可解釋的代碼、理解業(yè)務(wù)需求、保障企業(yè)級(jí)安全,并且結(jié)合了大語言模型的優(yōu)勢(shì),幫助我們做數(shù)據(jù)的解讀和決策建議。
我們可以通過自然語言進(jìn)行提問,用戶不需要了解數(shù)據(jù)是什么樣子,比如“誰賣的最好”,北極九章DataGPT的語義解析引擎可以理解各種各樣的嵌套問題、模糊問題、補(bǔ)全問題。有了北極九章DataGPT,在整個(gè)的數(shù)據(jù)分析的流程當(dāng)中,可能打字或語音問問題變成了最長(zhǎng)的環(huán)節(jié),每個(gè)問題都可以在毫秒級(jí)時(shí)間內(nèi)獲得答案。
基于我們的Auto Insight自動(dòng)分析引擎,機(jī)器不僅回答你的問題,還主動(dòng)告訴你這個(gè)數(shù)據(jù)怎么樣、為什么、有什么風(fēng)險(xiǎn),相當(dāng)于復(fù)制了一個(gè)3~5年數(shù)據(jù)分析師的能力,快速幫你定位問題。如果你不知道該問什么,或者沒找到想要的答案,我們基于推薦算法加人工校準(zhǔn),不斷學(xué)習(xí)和迭代,讓它越用越好用。
在工作中,我們更習(xí)慣在即時(shí)通訊工具或在手機(jī)上和人溝通。北極九章也可以成為IM的一部分,在企業(yè)微信、釘釘、飛書中通過與機(jī)器人對(duì)話分析數(shù)據(jù)。我們甚至可以作為WPS插件,在你的任何一個(gè)文檔中搜索分析,把圖表插入文檔。我們還有另一個(gè)黑科技,如果我周三就把報(bào)告寫完了,在周五的時(shí)候直接點(diǎn)擊一下更新數(shù)據(jù),就能直接更新文檔里的圖表,讓你的報(bào)告數(shù)據(jù)永遠(yuǎn)最新最實(shí)時(shí)。
我們還發(fā)現(xiàn),大語言模型可以解放IT團(tuán)隊(duì)的生產(chǎn)力。原來IT團(tuán)隊(duì)配置數(shù)據(jù)分析模型是非常耗時(shí)和繁瑣的。通過AI的能力,我們可以在一分鐘以內(nèi)自動(dòng)化地解析和配置數(shù)據(jù)。
我們認(rèn)為,當(dāng)一個(gè)產(chǎn)品足夠簡(jiǎn)單、足夠強(qiáng)大的時(shí)候,數(shù)據(jù)可以給每一個(gè)人使用。傳統(tǒng)的數(shù)據(jù)分析軟件使用者太少,數(shù)據(jù)價(jià)值的變現(xiàn)只能是空中樓閣和遙不可及的存在。
我們服務(wù)了國(guó)內(nèi)最大的保險(xiǎn)經(jīng)紀(jì)公司之一,這個(gè)公司有上千號(hào)人,投入了大量精力建設(shè)數(shù)據(jù)中臺(tái),但是他們發(fā)現(xiàn),業(yè)務(wù)人員在上中臺(tái)之前大概需要一到兩個(gè)月的時(shí)間獲得一個(gè)數(shù)據(jù)看板,上中臺(tái)之后還是需要一兩個(gè)月的時(shí)間,數(shù)據(jù)中臺(tái)的建設(shè)成果,其實(shí)并沒有被業(yè)務(wù)人員感受到。
使用了北極九章之后,業(yè)務(wù)人員直接使用搜索的方式,立刻就可以通過數(shù)據(jù)定位到哪些保險(xiǎn)產(chǎn)品在哪些子公司理賠周期過長(zhǎng)或者過短,相當(dāng)于為整個(gè)團(tuán)隊(duì)帶來了超過40個(gè)人的額外分析能力,每年節(jié)約超過1000多萬元的機(jī)會(huì)成本。讓我們感到非常欣喜的是,這個(gè)公司之前很多的決策都是靠拍腦門,現(xiàn)在業(yè)務(wù)人員會(huì)主動(dòng)想決策之前是不是可以先搜索問問數(shù)據(jù)。
不久前Gartner發(fā)布了2023年數(shù)據(jù)分析的十大關(guān)鍵技術(shù)。2023年,企業(yè)會(huì)部署的新興技術(shù)包括增強(qiáng)數(shù)據(jù)和分析、自然語言處理和決策智能;會(huì)話式用戶界面、自然語言生成、Transformer模型和大規(guī)模預(yù)訓(xùn)練語言模型預(yù)計(jì)也將會(huì)全面應(yīng)用于企業(yè)。可以看到,全世界最領(lǐng)先的企業(yè)都在尋求通過數(shù)據(jù)和分析帶來可量化的價(jià)值,構(gòu)建信任培養(yǎng)數(shù)據(jù)和分析文化。
過去的幾十年,我們?cè)跀?shù)據(jù)建設(shè)方面雖然有了長(zhǎng)足的進(jìn)步,但是我們的數(shù)據(jù)其實(shí)大而不強(qiáng),相比于歐美領(lǐng)先國(guó)家,仍有至少十年的差距。當(dāng)AIGC趨勢(shì)到來的時(shí)候,我們的企業(yè)如何去布局未來十年?如何在激烈的競(jìng)爭(zhēng)中贏得優(yōu)勢(shì)?
可以確定的是,我們沒有時(shí)間像過去一樣慢慢培養(yǎng)專業(yè)人才、組建團(tuán)隊(duì)。未來的十年,人和機(jī)器直接對(duì)話會(huì)成為趨勢(shì),我們的工作將不會(huì)是不停操作Excel和看板,而是通過我們最習(xí)慣、最自然的溝通方式,在AI的幫助下隨時(shí)問出問題。
量子位發(fā)起的CEO/CTO系列分享活動(dòng),不定期邀請(qǐng)前沿科技領(lǐng)域創(chuàng)業(yè)公司CEO/CTO,分享企業(yè)最新戰(zhàn)略、最新技術(shù)、最新產(chǎn)品,與廣大從業(yè)者、愛好者探討前沿技術(shù)理論與產(chǎn)業(yè)實(shí)踐。歡迎大家多多關(guān)注 ~
需要觀看直播回放的小伙伴,可以戳鏈接噢: https://www.bilibili.com/video/BV1VM4y1t7SK
— 完 —
標(biāo)簽: