如何使用AI提高個人生產力與團隊價值,數據科學家的觀點

Photo by DeepMind on Unsplash

近日AI技術的超級進步與科技巨頭們的發表使得AI與人機協作的應用多了許多想像空間,例如自動化重複性工作、幫助我們管理日程和回答問題等等。這些功能可以讓我們更有效地利用時間和精力,從而提高個人生產力。你可以看到資本、技術、人才都在湧入這個賽道,讓這個領域的發展速度相當驚人,而不只是科技巨頭,多數公司與個人開發者也可以快速串接開源LLM來調整訓練、串接自己的應用服務。

而除了商業應用,多數工作者也關心該怎麼整合AI服務到自己的工作流程中,讓工作更有效率,提高個人生產力。個人從去年ChatGPT問世以來就持續在開發自己與團隊的AI協作流程,因此下文將會分享一些個人心得:

  1. 我怎麼思考AI來開發自己與團隊的AI協作工作流程
  2. 三個使用AI工作的思考原則與個人實際案例
  3. 對AI人機協作的想像

文中也會分享自己在過去數位轉型案例中看到企業流程協作與開發AI use case 的機會點。

AI 應用的本質:資料格式的轉換與非結構化數據的分析處理能力

首先對於AI的應用本質,我的理解是「N2N」,也就是形式上自在轉換不同「資料格式」。比如現在的文字轉文字(ChatGPT)、PDF轉文字(ChatPDF)、語音轉文字(PodcastGPT)、文字轉圖片(Midjourney)

上圖為 Bain Corp 對於 AI 應用的想像與介紹,與自己的理解非常類似

而這個過程可能是放大從輸入到輸出的資訊量,進而產生結果,如通過簡短的Prompt 生成報告、圖片 ; 也可能縮小資訊量,如請AI摘要資訊量大的報告、摘要影片的內容。

這並不是新概念,過去數據科學的深度學習很大一部分的價值就是將非結構資料轉成結構資料[註:結構資料通常是二維表格形式如Excel, csv,非結構化則是各種形式通常用json, mp3, jpg等],這是一種資訊量大到小的過程。如行銷科技的應用從多種商品圖片中萃取出質感、顏色等「標籤」,或者量化交易公司從停車場車輛照片、農作物空拍顏色獲得「流量、產量」等結構化數據。

類似於主管交辦任務,而成員交付產出,理論上每個個人都是一個小型管理者,協作對象為AI。

因此在思考應用上,我會去想:

不同的場景需要什麼樣的「資料」:明確產出

比如我要設計簡報,那麼產出就會是文字與圖片資料

2. 所投入的資料與產出的資料差距:量化生產力提高程度

比如輸入10~20字的字串,產生100~200字的報告,就是10倍的差距

用10分鐘測試輸入30~50個詞,產生4~8 張耗時人工3~5天工作天的圖片

3. 需要AI的步驟與需要人的步驟:確保可控性

AI與人的協作是仿生關係,比如確認報告中關鍵數字的正確性、建立產出框架(如特定格式的回答方式、特定風格的圖片)

這樣一來就可以設計出許多個人需要,且足夠有價值的AI工作應用。經過這種思考方式之後,我目前個人有在使用且付費的AI應用程式包含:Notion AI, Github Copilot,而使用中免費的AI應用則有多種生成圖像的應用(如MJ,純粹好玩)、ChatGPT、ChatPDF、Perplexity AI 。

從上面的工具來看,我目前只專注在既有流程的資訊輔助「減少/生成資訊」上(減少內容如查找資訊、比較分析,生成內容如程式碼、文章大綱、摘要),但是並未用在完全的生產力解放上(如100% AI 生成圖片、100% AI 建立報告),未來預期會使用更多服務來提高個人生產力與輔助工作流程。

1. 知識搜尋引擎

這部分可以分成公開與個人兩個方面來說明,而知識搜尋建立在資訊整合與學習的行為上面,比如搜索未知的資訊、確認已知的資料、整理未知的資料來創造已知的資訊等…….

公開

不論寫程式、研究算法、商業分析,在過去都脫離不了Google,然而需要的資訊經常十分龐雜,且中文搜索引擎經常混雜到大陸各種轉發、轉傳、拷貝的重複內容、英文搜索則充斥大量廣告、付費式的內容,因此在知識搜索上使用ChatGPT等工具可以更好得到需要的資訊,比如複習某種算法的原理、提供某些問題的解決方案思路。

gpt example

我個人最常用的Prompt包含「你是一位XX專家,建立一個XXX、分析XXXX 優缺點、適用性、好處壞處….」,並通過追問、補充特定資訊的方式來得到我需要的結果,在這方面ChatGPT的免費版本已經足夠好用

個人:

每個人都應該建立自己的知識庫,現在的筆記軟體盛行,要累積個人需要、反覆使用的資訊並不困難(如SOP、知識筆記)。法人也不例外,公司應該建立自己的知識庫。在過去,我們可能依賴於「搜索」的方式來查找自己的資訊,因此整合資訊的效率取決於筆記軟題的搜索功能強度(如我個人最愛用的EverNote) ;

如圖:Evernote 的搜索功能強大, 也可以辨識出圖片中的關鍵詞, 並可依照關聯度排名

但在「現在開始的未來」,「提問」的方式變成資訊整合最主要的行動方式,因此很大程度筆記軟體的整合效率會取決於該公司LLM的下游Tuning(可以理解為公司將大型語言模型的服務「落地到自家服務的適配性」),以Notion AI 為例,我在工作上與一部分的知識都已經在Notion建檔,因此通過 Notion AI 能夠通過Prompt來得到自己整理的內容與結果。

就我所知另外一個筆記軟體Heptabase就直接把這種「資訊整合」的提問方式做成一個功能。

Prompt interface
https://heptabase.com : Heptabase 這種 Personal Google 的構想十分符合我對知識管理的思考觀念

個人的另外用途還有資訊摘要,如使用ChatPDF來閱讀論文、使用 Perplexity AI 來搜索相關文獻等,取代以往的 Google Scholar 與 pdf browser

chatpdf interfacce : 可針對pdf 的內容提出問題:更快速檢索資訊

至於Podcast、Video 轉摘要個人現在用的並不多,原因是我認為閱讀在人性上更偏向是一種主動的行為,精力有限,我會需要更準、更精的資訊,通過提問來協助思考。然而Podcast、Video等媒體通常會在我的零碎時間中出現,此時我的精力其實是放鬆的狀態,因此媒體的單向輸出更適合,不然還要手動Prompt跟想提問,其實不會特別休息到,也無法全心在吸收跟思考上。

因此以主被動的方式來看,Video 跟 Podcast 的prompting 更適合出現在主動性的工作內容上,好比我是一個要聽法說會的分析師,那麼使用 Video to text 來快速產生Raw note 可能會很有用 ; 我是一個一天要打好幾通專家訪談的顧問,那麼使用 Voice to text 來整理好幾小時的錄音檔也會非常有幫助。

2. 自動化重複性工作

多數自動化任務使用既有的數位流程可能更符合人性

使用AI預期可以自動化許多重複性工作,例如發送電子郵件,處理文件,生成報告、圖片等等。這樣可以節省工作者的時間和精力,並把時間花在更具有價值的事情上。

有趣的是,雖然自動化是一個大家對於科技發展常見的想像場景,但從我之前在管顧業參與過的數位轉型專案來看,AI在這部分的幫助可能並不如大家想像得那麼大。首先,多數流程其實存在規則式的範式,需要的輸入跟產出都非常明確,這並不一定需要AI嫁接其中,反而規則式程式碼容易控制,而這種自動化任務在有了程式這個概念之後就可以執行。其次,容易控制的流程相比不穩定的流程還要容易被人們接受。

省了時間不見得省了精力

15分鐘執行時間的程式,完全自動化 v.s. 5秒自動化、但需要手動確認與檢查的AI程式,前者的可接受性更高,因為前者只需要一次工作,後續不出什麼大事基本上可以放著不用管它,這才是真的「解放勞動」,因為所有的流程有如玻璃,你完全可以預期會得到什麼結果。然而後者的問題就大得多,雖然每次執行很快,但是結果難以控制、或者需要額外調整,即使額外調整的時間僅需10~30秒,但每天這麼做依然在流程上擺脫不了人為的參與。

就好比傳統CRM人員可能更相信人為定義的RFM分群會比K-means RFM來得好,有了更進階的算法不見得會有更好的效果。

機會點存在於那些人為每天得做,但是資訊複雜的任務,而這種任務就是常見的AI use case,比方說電商打擊假貨,這個其實算是一種重複性工作,描述起來也不如個人化行銷、存貨預測等其他AI任務聽起來那麼酷炫,但是這種任務是必要的,且難以寫程式排查(因為品類太多、特徵不明確)。此時的自動化任務就可以通過 AI 來進行,即使結果也並不是很穩定(FP/FN ,如弄假成真、錯抓正版),但後續人為排查的精力可大幅縮小(比如抽樣幾個結果來大致了解運行效能、重新訓練模型檢查評估指標等等……),工作時間也大幅被縮短,就會是一個十分有價值的自動化任務。

新時代管理者的課題可能還包括決策不同流程、議題讓AI參與、數位化參與、人為參與的程度與取捨。

對於自動化任務個人還是充滿期待的,但現階段我認為這不是自己主要探索AI應用於自己生產力的領域,原因就如上,企業級的流程自動化中經常還是需要人為控制部份因素、或者檢證AI產生的結果(比如檢查 Email的文案、發送通知的名字是否正確)

這種場景之下通常可以80%程式、20%人為完成,不一定需要仰賴AI自動生成,也不能保證AI自動生成的流程可以更容易被人們信賴 ; 相比於程式控制的流程與清晰的邏輯,AI提供的流程生成可控性沒那麼高,測試一個Prompt的時間也比大家想像中的久。

以ChatGPT為例,他的輸出時間不像語音助手如Siri 那麼流暢(但這是因為文本應用本來就不太要求即時順暢的關係,所以在工程上開發團隊不見得需要解決這個問題、達到這個要求)

chat got 的feedback survey

你可以發現他的回答速度並不是很穩定,即使按下重新生成回答,結果也可能不如預期,從目前使用 Regenerate response 1~2次就會產生一個Feedback Survey 來看,開發團隊很有可能正在專注解決Prompt testing 的問題,也就是不讓使用者去學習怎麼Prompt,而是讓ChatGPT更容易從極少的測試理解使用者的意圖。

https://www.microsoft.com/en-us/microsoft-365/blog/2023/03/16/introducing-microsoft-365-copilot-a-whole-new-way-to-work/ 個人最期待的AI應用之一

總結來說,微軟之後就會推出Office Copilot ,到時候勢必會有更多實際案例與人工智能流程發展的場景,現階段個人認為當前的AI成熟度在自動化這部分的幫助,相比於既有的數位工具流程優化、程式自動化並不是特別大。等到辦公軟體的主流Office 都開始發展應用,我想到時候自己就會開始研究更多AI自動化工作的內容。

3. Prompt and tune 的工作方式

Chat box as interface

Prompt and tune (提問與調適 — 調整測試)

我認為過去的工作習慣可能更偏向於Give and get ,因為流程、產出明確,所以容易通過規則的方式(傳統寫程式、建立PPT模板、制式化表單等)來提升工作效率,在多種職業的工作場景都可以看到共通的「類流水線」模式,不同工作者的輸入可能來自另一位工作者的產出,如工程師需要依照設計師的產出實作 ; 供應鏈需要財務分析的產出去談判,這是一種相對線性的工作流程,會產生出迭代通常是因為後者的流程瓶頸,如功能實作效益不符合成本請設計師修改、談不到價格所以請財務再評估一次 ……. 因此專案管理的技能更偏向處理多工協調、規劃、評估。

但是 Prompt and tune 更偏向於螺旋式工作,因為AI可以扮演不同的角色(如ChatGPT的promot中可以請他做角色扮演),因此對於上面的組合式工作流程來說,每個工作者的節點都可以替換成AI,那麼這裡會有兩個插入的工作方式:

  1. 工作者在節點:每個工作者在負責的節點使用AI
  2. 工作者在流程:控制流程而非節點,在節點完全採用AI

1.的部分我們在第一段討論過,因此來看2,這時候的每個人都是負責一個流程,因此輔助的節點要足夠強大,這意味著得讓AI成為專家,而要讓AI成為專家,就需要控制流程者提出好的Prompt,以及使用Tuning 版本的AI,這種工作流程一旦成為主流,那麼就有大量利基市場的新創機會,不同公司有自己擅長的專家AI,然後我們使用這些服務。

這也不是新概念,以SaaS 、按量付費的API服務來說,我可以讓工作者在節點使用特定API ,也可以打造一個基於雲服務的機器學習應用,此時的我更像是一個雇用不同API服務的流程管理者。

這種思考方式會影響到 Prompt 的個人化使用,以我現在使用Github Copilot 為例,過去已經有很多程式碼提示工具,Give and get 的方式就是我展開特定語法,然後做程式碼補全(如輸入imp,提示出import XXX),如果我不是以imp開頭,那麼機器無法得知我要做讀入套件的意圖。

過去的prompt, 只是省下輸入時間

但是改成用Copilot 之後,我可以在更高層的角度說我要畫一張圖,而因為必須import才能使用畫圖的套件,因此程式碼的提示不只會幫我畫出圖,還會順便import。

copilot prompt : 我需要專注在設計產出形式(prompt)與微調AI結果(Tuning)

總結來說,過去的Prompt更像是概念1,我必須把任務都拆得足夠小,才能夠開始用一些工具來提高生產力(如打好每一行的每一個字,在精力付出上並沒有太多節省,只是節省了手動輸入的時間)

但是從現在開始的未來,我可以把流程拆解成節點,做好骨架,AI 就會自動幫我把肉補全,剩下就是Tuning 其中的肉。這更接近於概念2,我腦中思考的內容並不是回想語法、設計寫法,而是可以專心在處理任務的例外情況與可共用的流程節點協調、以及每個節點該完成的任務,而AI會幫我做完剩下的工作。

而除了服務端Tuning,應用端也要Tuning,最常見的就是各家業者使用自家的數據來調整訓練數據,並串接既有的服務,如Bloomberg AI 、Duolingo AI 。

但是個人其實也可以Tuning,Tuning 的好處在於你可以從多次的Prompt與Feedback 中得到更符合預期的結果。

以數據科學專案為例,在Python中有意識更高頻使用Assign的寫法,讓AI融入分析過程。當我在工作上已經先設定出 target_category_products = [’iPad’ , ‘Mac’],建立”product list = “時會得到該類別下特定型號的提示 ; 而分析另外一個餐廳數據集時,在給定變數 measurement = “sales” 之後,我之後要撰寫新的變數時,AI不只知道我要做的計算,甚至會自動提示出有意義的變數命名如sales_growth_rate = XX, sales_by_stores 等變數來做中間的處理,這是非常令人享受的工作流程。

從上面的例子來看,以寫程式來說,過去因為時間耗費長,所以人們可能更習慣建立通用的函數,然後調用該函數來節省時間,而通用的問題就在於可讀性不一定高(df的命名)、人為標記讓名字過長(如run_XXX_for_customer_df)

但是現在我們可能要稍微轉變一下思考方式,維持函數的可通用性,但在名稱上有意識建立出具體的範例與獨特的名稱,讓 AI了解我們的意圖從而在接下來的協作上建立出更符合當前場景的應用,我認為這也是一種Tuning,你必須讓AI明確得知你的意圖,讓它學習到你給予的模式,人類跟AI的協作才會更有效率(更符合預期的結果)。寫程式這種充滿邏輯與規則的工作型態既是如此,我認為各行各業的AI應用也將會朝這種個人化可調試的方向走。

那麼ChatGPT或者其他應用也可以嗎?

而以大家常用的ChatGPT來說,你可能要開始建立不同的Chat Channel,類似Slack,每個Channel有一個自己的專家,這樣在調用上會出現更好的結果。比方說我跟ChatGPT聊了30分鐘左右的保養品,當我提出「疫情復甦後的旅行用保養品機會是什麼?」相比一個只問了幾句「快消品市場」全新的GPT,同樣都具備回答問題的能力,前者的回答更貼近我的假說與能夠提出更具體的思路與一些想法,後者則是一些非常廣泛的答案。

延續相同語境,可以讓需要的prompt更短, 但答案更符合期待

這也會影響到後續的Prompt,當我輸入「請說明2021的流行趨勢」之後,我只要輸入「2020呢」,AI 就能夠仿照類似的回答範式給我不一樣的答案,但是直接輸入「2020」則是理所當然的語境不足,AI無法得知我想要的資訊是什麼。

而在生活場景亦然,以Apple最近發表的Watch錶帶與系統更新來說,人們也可以Tuning 健康智能,如跑步用、辦公用來讓AI更理解你現在的身體、行為狀態等提供更合適的紀錄與資訊(如運動中心肺提醒、辦公環境提醒站立、休息等)。

總結:從個人工作流程思考而不是追逐buzzword

使用AI可以幫助我們更有效地管理時間和精力,從而提高個人生產力。我們應該從現有的工作流程中出發去思考AI技術的機會,而不是追逐新的應用生搬硬套到某些不一定適合的工作流程上。

我認為適應是自然而然的, 最好不要有AI是一個全新東西的想法, 這會讓你焦慮到去買一些AI的課程、忙著下不熟悉的prompt, 而是專注思考怎麼串連到既有的知識體系跟習慣裡面,習慣成自然。

現在市場上最多人討論的還是圖像生成的技術,如遊戲NPC的生成、影音偶像、藝術作品結合之前的NFT熱潮等…… 不可否認這些領域的商業潛值巨大,每次突破也蘊含對超未來想像的驚喜,然而對我們每個人來說,前面這幾項AI應用的發展重要性可能不如於你現在手上的筆記軟體、開發工具、到穿戴式裝置與物聯網家居系統,因為這些離我們很近的機會能夠優先提高個人生產力與生活品質,讓你有更多時間與精力去適應未來AI與人類共存的社會。

歡迎想學習Python資料科學、商業分析、金融知識的人一起交流!本部落格的內容全部都是基於「分享」的實作、理論兼顧文章,希望能夠幫助到所有對資料科學領域有興趣的人們,長期關注可按左手邊的Follow!若喜歡我在 Medium 的內容,可以拍個手(Claps)這邊想做個實驗,好讓我知道你/妳喜不喜歡這篇文章:
拍 10 下:簽個到,表示支持(謝謝鼓勵!)
拍 20 下:想要我多寫「商管相關」
拍 30 下:想要我多寫「資科相關」
拍 50 下:我有你這讀者寫這篇也心滿意足了!

敬請期待下一篇!或是您也可以逛逛我的其他資料科學文章,到我的主頁置頂文章獲得良好的目錄體驗。

Python資料科學系列:

如果想跟著我實作資料科學,開始寫程式必知必會基礎系列:

--

--

戴士翔 | Dennis Dai
Finformation當資料科學遇上財務金融

外商分析顧問,Ex- Apple Data Scientist,曾在FMCG巨頭/日商管顧/MBB管顧/高成長電商從事商業分析與數位轉型,專注分享管顧、商業、數據分析的思考。分析/演講/合作歡迎來信:dennis.dai.1011@gmail.com