[AI時代的工作哲學](2) 原來數據標註是這麼一回事

2019-11-13
{{ (language == 'en' ? 'Social Innovation Organization' : '社會創新組織')}}
若水國際股份有限公司
1509
{{ (language == 'en' ? 'No Poverty' : '終結貧窮')}} {{ (language == 'en' ? 'Decent Work and Economic Growth' : '良好工作')}} {{ (language == 'en' ? 'Reduced Inequality' : '促進平等')}}
[AI時代的工作哲學](2) 原來數據標註是這麼一回事

圖片來源:若水AI
文:Jane Su / 若水 AI 商業開發部門

在 AI 產業工作的日常,若水數據標註團隊幾乎都用自己開發的標註平台,完成客戶交付的任務。
我們經歷了許多跌跌撞撞。從原本一個單一的數據處理平台,發展到至今,能處理各式各樣數據需求,像是畫點、畫四邊形、畫多邊形,以及貼標籤等等,就像似小時候常玩的「小畫家」。
常碰到有人問,若水為什麼不用已經開發出來的就好,還要投入這麼多心力與時間重新建置平台?


這一切還是要回到使用者端來回答。

在AI產業中,工程師們需要大量被清理過且精準地標註數據,這能夠幫助他們訓練模型。而這些標註數據最原始的樣貌可能相當雜亂無章,經過數據處理團隊的巧手,將數據先做第一層次的清理,進而去標註要電腦學習的目標物。

所以,數據標註工具與平台對這群數據標註師們至關重要。舉例而言,若一個數據平台只有單一功能,可能只能畫出Bounding Box或是Segmentation,這讓數據處理的範圍大幅地給受限了。因此,一個好的數據處理平台必須要保持彈性,隨時根據客戶和AI市場需求,調整或新增它的工具。

在若水數據處理平台,每天還會產生良率產能報表,同時搭配著數據標註師們的提問加以分析,比對他們日常良率表現。一個高良率的標註師,如果當日表現沒有到達日常水準,品質管理人員就會馬上去了解問題何在,例如,對要標註的數據、定義不清楚、人為疏忽、又或者平台介面功能不友善,透過刪去法一層一層找到根因,解決問題。

每當平台有新上線的功能,若水都非常鼓勵標註師隨時提出意見作為回饋,而在市場客戶這一端,遇到PoC(Proof of Concepts)驗證型專案時,若水也會隨著第一次驗證結果,微調平台上功能。

用一句話來歸納:若水數據處理平台是為客戶而生、為標註師而戰。

也因為若水的數據平台使用者,主要以居家標註師為主,他們身體狀況、障別涵蓋非常多元。我們的數據平台,也因此開發出許多特色。
一直以來,若水與專業設計師、職能治療師和認知心理學家合作,致力於數據平台的UI/UX,讓這些數據標註師們能夠方便地使用工具,透過不同的UI/UX設計,加快處理數據的速度。以「快捷鍵」設計來說,有些夥伴僅能使用單側身體來工作,我們便會去思考最恰當的單側快捷鍵配置方式。

圖片來源:若水AI
圖片來源:若水AI
 

相較於能面對面溝通的一般工作者,若水必須排除遠距工作所產生的重重障礙,同時還必須讓這些居家標註師們做出高品質的數據。除了不斷打造好用的平台之外,我們也持續優化工作間的溝通流程,讓所有線上、線下的團隊成員能深度協作。若水AI部門的專案總監黃子祥分享他的寶貴經驗:

第一,明確表示正確的執行指令(What),並搭配畫面輔佐,若水甚至以拍攝影片的方式來告訴居家標註師們,應該怎麼做才能把圖片、影像標註好,達到應有的良率水準。

第二是明確表示執行指令會是在哪一場景、哪一時間點被執行(Where、When),舉例來說,標註師要瀏覽訓練手冊的第幾頁、第幾個步驟來執行某個指令。黃子祥分享了小技巧,「每一個東西都要給予一個對應編碼,才能讓彼此溝通上不會有落差。」

第三則是回饋必須及時,當標註表現得好時,要適時給予肯定,而當沒有做到位時,也必須立即修正,以避免掉一些重工的風險。

標註師小兵立大功,創造自己的工作 SOP
最近這幾個月,我們觀察到了一個有趣的現象,團隊中有表現特別突出的數據標註師,他們的產量、速度是平均值的兩倍之多,簡直就是快狠準!我們去特別研究之發現:

(1) 高頻率地使用數個快捷鍵,取代掉大部分鍵盤功能;

(2) 透過經驗累積,發展出自己一套獨有數據處理SOP。

若水透過及時線上對談、居家訪視,了解標註師們各自的專長和優勢,持續這些技巧和數據處理 know-how 導入到職前訓練中,讓所有專案中的參與者明白數據標註不僅止於處理單點的問題,而是每個細節環環相扣。

標註,這件看似簡單不燒腦的事,若水卻選擇用最高規格對待:開發自用平台,並透過即時溝通、對話,掌握最佳產出品質。同時也希望在 AI 起飛的高速時代,為居家標註師們能打造一身好裝備與武器,培養出多元數位職能。


----------------------------------------------------------------------------------------------------------------------
【[AI時代的工作哲學](2) 原來數據標註是這麼一回事 】 由若水國際 Flow, Inc. 撰寫,轉載於這裡
若水為一家兼顧獲利和助人的社會企業,致力在雲端產業、AI 人工智能、BIM 領域中開創新的商機,運用商業的力量,在創造利潤的同時,也創造社會影響力。

 

更多詳情,請參閱官網:https://www.flow.tw

{{ language == 'en' ? 'more cases' : '你可能會感興趣' }}