今天你低代碼了嗎？（低代碼是什么）

投稿用戶 ? 2024年1月11日 am10:42 ? 科研百科 ? 閱讀 137

編輯導(dǎo)語(yǔ)：當(dāng)下，各行各業(yè)都在尋找可以降本增效的效率途徑，AI人工智能、機(jī)器學(xué)習(xí)等概念也被廣泛應(yīng)用至業(yè)務(wù)中；而亞馬遜云科技推出的0代碼機(jī)器學(xué)習(xí)智能工具——Amazon SageMaker Canvas，就是一款可以應(yīng)用于數(shù)據(jù)分析業(yè)務(wù)中的工具。本文作者就對(duì)這款工具做了體驗(yàn)測(cè)評(píng)，一起來(lái)看。

今天你低代碼了嗎？（低代碼是什么）

隨著人工智能技術(shù)的發(fā)展和普及，人們對(duì)機(jī)器學(xué)習(xí)和數(shù)據(jù)分析的需求一直居高不下。幾乎沒(méi)有哪個(gè)行業(yè)在交易中不涉及機(jī)器學(xué)習(xí)。

在這一背景下，與許多大型科技公司一樣，亞馬遜云科技也推出了一款無(wú)低代碼機(jī)器學(xué)習(xí)平臺(tái)——Amazon SageMaker Canvas，今天就讓我們來(lái)試用一下吧。

一、測(cè)評(píng)說(shuō)明

測(cè)評(píng)人：剛畢業(yè)一年的B端產(chǎn)品經(jīng)理，碩士畢業(yè)，計(jì)算機(jī)專業(yè)，機(jī)器學(xué)習(xí)方向；
測(cè)評(píng)對(duì)象：Amazon SageMaker Canvas（一款低代碼機(jī)器學(xué)習(xí)平臺(tái)）；
測(cè)評(píng)目的：對(duì)產(chǎn)品的可操作性（用起來(lái)方不方便）、預(yù)測(cè)準(zhǔn)確性（好不好用）進(jìn)行測(cè)評(píng)。

二、使用體驗(yàn)測(cè)評(píng)

1. 對(duì)沒(méi)有機(jī)器學(xué)習(xí)知識(shí)的人友好

作為一個(gè)有機(jī)器學(xué)習(xí)專業(yè)知識(shí)背景的新用戶，我從最初的賬號(hào)注冊(cè)，到最終使用SageMaker Canvas構(gòu)建模型，花費(fèi)了不過(guò)半天時(shí)間，非但不用在本地電腦裝各種軟件、各種庫(kù)、各種包，還省去了幾百行的機(jī)器學(xué)習(xí)代碼，整個(gè)過(guò)程無(wú)需編碼即可構(gòu)建機(jī)器學(xué)習(xí)模型，完成對(duì)本地?cái)?shù)據(jù)的預(yù)測(cè)分析。

對(duì)比過(guò)去和現(xiàn)在，如果你想使用機(jī)器學(xué)習(xí)算法對(duì)手頭上的數(shù)據(jù)進(jìn)行分類、預(yù)測(cè)：

今天你低代碼了嗎？（低代碼是什么）

表1 過(guò)去 VS. 現(xiàn)在

2. 界面風(fēng)格簡(jiǎn)潔

以產(chǎn)品經(jīng)理的視角看，Amazon SageMaker Canvas每個(gè)頁(yè)面的排版樣式、控件設(shè)計(jì)及交互效果都非常的通俗易懂。

例如，登錄Amazon SageMaker Canvas的工作臺(tái)后，能在其中查看該賬戶下所有已創(chuàng)建模型和已導(dǎo)入的數(shù)據(jù)集。其中，模型列表支持兩種展現(xiàn)形式：卡片列表和表格列表。

我個(gè)人比較喜歡卡片列表，因?yàn)榭ㄆ斜硐啾扔诒砀窳斜?，樣式要活潑很多，能讓?yè)面顯得不那么死板和單調(diào)。接著進(jìn)入一個(gè)模型之后，會(huì)看到選擇數(shù)據(jù)>>模型構(gòu)建>>模型分析>>模型預(yù)測(cè)這四個(gè)步驟，這能指引用戶更便捷地完成模型構(gòu)建工作。

今天你低代碼了嗎？（低代碼是什么）

圖1 模型列表—卡片式

今天你低代碼了嗎？（低代碼是什么）

圖2 訓(xùn)練模型的步驟

三、功能測(cè)評(píng)

低代碼作為一種技術(shù)手段，自然有它獨(dú)特的優(yōu)勢(shì)，可低代碼機(jī)器學(xué)習(xí)平臺(tái)的預(yù)測(cè)準(zhǔn)確性相較于常規(guī)的python編程語(yǔ)言會(huì)有所下降嗎？

下文將從分類、預(yù)測(cè)兩大類場(chǎng)景使用Amazon SageMaker Canvas構(gòu)建模型，并將Amazon SageMaker Canvas構(gòu)建的模型準(zhǔn)確度與python編程語(yǔ)言得出的結(jié)果進(jìn)行對(duì)比分析。

1. 分類問(wèn)題

1）數(shù)據(jù)集

我們一般接觸到的分類問(wèn)題大多屬于二分類問(wèn)題，非此即彼。乳腺癌分類問(wèn)題就是機(jī)器學(xué)習(xí)中一個(gè)經(jīng)典的二分類問(wèn)題，建立乳腺癌風(fēng)險(xiǎn)評(píng)估模型，預(yù)測(cè)乳腺癌發(fā)生概率，對(duì)乳腺癌的防治具有重要意義。

本文使用的數(shù)據(jù)據(jù)集來(lái)自美國(guó)威斯康星州公開(kāi)的乳腺癌診斷數(shù)據(jù)集，醫(yī)療人員采集了患者乳腺腫塊經(jīng)過(guò)細(xì)針穿刺后的數(shù)字化圖像，并從這些數(shù)字圖像中提取了32個(gè)特征，用這些特征描述圖像中的細(xì)胞核呈現(xiàn)。

數(shù)據(jù)集共569行，每行數(shù)據(jù)具有32個(gè)特征，第一行是id，第行為diagnosis診斷類型（良性/惡性），第3-32個(gè)特征其實(shí)只包含了十個(gè)屬性，只是每個(gè)屬性都從3個(gè)維度：平均、標(biāo)準(zhǔn)差、最大值去分析，所以總共有30個(gè)特征。

今天你低代碼了嗎？（低代碼是什么）

表2 乳腺癌數(shù)據(jù)集說(shuō)明

2）對(duì)比分析

使用Amazon SageMaker Canvas實(shí)現(xiàn)乳腺癌分類的步驟如下：

① 登錄Amazon SageMaker Canvas。

② 數(shù)據(jù)準(zhǔn)備：導(dǎo)入本地?cái)?shù)據(jù)到Amazon SageMaker Canvas。

③ 構(gòu)建模型，選擇數(shù)據(jù)集中的某一列作為讓模型去預(yù)測(cè)的目標(biāo)列，此時(shí)SageMaker Canvas會(huì)根據(jù)該列的值，自動(dòng)識(shí)別該問(wèn)題是分類問(wèn)題還是預(yù)測(cè)問(wèn)題。在我導(dǎo)入乳腺癌數(shù)據(jù)集，選擇了“diagnosis”列作為目標(biāo)列后，Amazon SageMaker Canvas判斷其為二分類問(wèn)題。的確，該列只有兩種值：B表示乳腺癌良性，M表示乳腺癌惡性。

除此之外，SageMaker Canvas會(huì)自動(dòng)對(duì)上傳的數(shù)據(jù)集進(jìn)行預(yù)處理，例如，使用數(shù)據(jù)集中毗鄰的值來(lái)推斷缺失值，且能提供數(shù)據(jù)集中每列的數(shù)據(jù)是如何分布的，這極大省去了在使用python進(jìn)行分類時(shí)的特征預(yù)處理以及特征選擇的工作。

今天你低代碼了嗎？（低代碼是什么）

圖3 使用python進(jìn)行特征預(yù)處理

接著點(diǎn)擊構(gòu)建或預(yù)覽模型，SageMaker Canvas會(huì)從自身封裝的眾多模型中為你推薦最合適的一個(gè)，并將特征按照重要程度排名，你可據(jù)此看出哪些特征對(duì)機(jī)器學(xué)習(xí)模型影響最大，去掉不重要的特征，點(diǎn)擊更新模型，待到模型準(zhǔn)確率無(wú)明顯變化后便可不再調(diào)整。

今天你低代碼了嗎？（低代碼是什么）

圖4 特征重要程度排名

講到這里，大家肯定想印證一下，用python編程語(yǔ)言篩選出的特征和Amazon SageMaker Canvas給出的特征排名，二者之間有沒(méi)有偏差，或者說(shuō)有多少是吻合的？下面就為大家揭秘。

如下圖所示，左側(cè)是Amazon SageMaker Canvas得出的排名，右側(cè)是python得出的特征相關(guān)性熱力圖，據(jù)此熱力圖選取相關(guān)性特征值維度值較大的特征。

今天你低代碼了嗎？（低代碼是什么）

表3 SageMaker Canvas Vs. Python

能夠識(shí)別患者是否罹患乳腺癌的分類器訓(xùn)練完了，那么如何評(píng)判這個(gè)分類器的優(yōu)劣呢？

傳統(tǒng)的評(píng)估分類器性能的方法是使用混淆矩陣來(lái)描述數(shù)據(jù)集的真實(shí)標(biāo)簽和模型預(yù)測(cè)標(biāo)簽之間的差異。此外，基于混淆矩陣，還可以計(jì)算出各種指標(biāo)來(lái)比較分類器的性能，如F1-Score、準(zhǔn)確率（Accuracy）、精確率（Precision）、召回率（Recall）、AUC值。

如下表所示，針對(duì)以上指標(biāo)，對(duì)比二者的結(jié)果。通過(guò)比較，使用Amazon SageMaker Canvas得出的模型評(píng)估值，和用Python中l(wèi)inear_SVM算法得到的結(jié)果幾乎吻合，近似一致。

只是AUC值一列，似乎存在一些問(wèn)題，Amazon SageMaker Canvas得出的為0.991%，python得出的是0.974，數(shù)值上是吻合的，但在度量上差了兩位小數(shù)點(diǎn)兒，這一點(diǎn)還有待進(jìn)一步探討。

今天你低代碼了嗎？（低代碼是什么）

表4 Amazon SageMaker Canvas VS. Python

今天你低代碼了嗎？（低代碼是什么）

圖5 SageMaker Canvas的混淆矩陣和幾大指標(biāo)

3）小結(jié)

分類算法的應(yīng)用范圍和涉及的場(chǎng)景非常多，涉及各行各業(yè)，我們要解決的問(wèn)題大都可以抽象為分類問(wèn)題.

就拿信用卡的生命周期來(lái)講，在營(yíng)銷期，利用分類算法對(duì)積累的客戶的數(shù)據(jù)進(jìn)行預(yù)測(cè)，找到潛在的推廣客戶，滿足個(gè)性化營(yíng)銷。

到審核階段，需要對(duì)客戶進(jìn)行資質(zhì)評(píng)估，無(wú)通過(guò)分類算法預(yù)測(cè)違約的概率，從而達(dá)到信用評(píng)級(jí)的目的。

到了穩(wěn)定期，隨著客戶的賬齡不斷增長(zhǎng)，客戶的資質(zhì)不斷發(fā)生變化，需要定時(shí)定點(diǎn)對(duì)客戶進(jìn)行風(fēng)險(xiǎn)的研究，及時(shí)發(fā)現(xiàn)風(fēng)險(xiǎn)客戶并進(jìn)行管理。

最后，到了衰退期，會(huì)涉及到客戶流失的問(wèn)題，需要用分類算法預(yù)測(cè)客戶流失的可能性有多高。

2. 預(yù)測(cè)問(wèn)題

1）數(shù)據(jù)集

波士頓房?jī)r(jià)預(yù)測(cè)是經(jīng)典的數(shù)據(jù)分析/機(jī)器學(xué)習(xí)入門(mén)項(xiàng)目，我們都知道，房?jī)r(jià)一般會(huì)與房間面積的大小、房子所在的城市、房子的空間布局等因素有關(guān)。而房?jī)r(jià)預(yù)測(cè)的任務(wù)就是給定與房?jī)r(jià)相關(guān)因素的數(shù)據(jù)，通過(guò)這些數(shù)據(jù)預(yù)測(cè)出房子的價(jià)格。

波士頓房?jī)r(jià)數(shù)據(jù)集：波士頓房?jī)r(jià)數(shù)據(jù)集來(lái)自卡內(nèi)基梅隆大學(xué)StatLib庫(kù)，涵蓋了麻省波士頓的506個(gè)不同郊區(qū)的房屋數(shù)據(jù)，404條訓(xùn)練數(shù)據(jù)集，102條測(cè)試數(shù)據(jù)集每條數(shù)據(jù)14個(gè)字段，包含13個(gè)屬性和1個(gè)房?jī)r(jià)的平均值。下表是對(duì)波士頓房?jī)r(jià)數(shù)據(jù)集的特征描述：

今天你低代碼了嗎？（低代碼是什么）

表5 波士頓房?jī)r(jià)預(yù)測(cè)數(shù)據(jù)集

2）對(duì)比分析

波士頓房?jī)r(jià)數(shù)據(jù)集中共計(jì)13個(gè)特征，每個(gè)特征都會(huì)或多或少的提升或者抑制房?jī)r(jià)?，F(xiàn)將SageMaker Canvas預(yù)測(cè)出的特征重要程度排名與Python機(jī)器學(xué)習(xí)算法得出的進(jìn)行對(duì)比，發(fā)現(xiàn)前7個(gè)特征中，有5個(gè)特征是重疊的，這證明SageMaker Canvas的模型預(yù)測(cè)性是值得信賴的。

比如，抑制房?jī)r(jià)最明顯的是特征NOX，它表示一氧化氮的濃度，基于常識(shí)可知，一氧化氮濃度越高，說(shuō)明住房所在地的環(huán)境污染越嚴(yán)重，房?jī)r(jià)也就越便宜。對(duì)房?jī)r(jià)提升最明顯的特征是 RM，對(duì)應(yīng)數(shù)據(jù)集可知，RM指的是每處住房的平均房間數(shù)量，這也是很容易理解，房間越多，房屋總面積就越大，面積越大，總房?jī)r(jià)就高。

今天你低代碼了嗎？（低代碼是什么）

表6 Canvas得出的特征重要性排名 VS. Python得出的

SageMaker Canvas除了能夠?qū)?shù)據(jù)集中影響預(yù)測(cè)結(jié)果的特征進(jìn)行重要性排名，還能清晰地展示出每一個(gè)特征和預(yù)測(cè)結(jié)果之間的關(guān)系（是正相關(guān)的還是負(fù)相關(guān)的），例如，LSTAT這一特征表示“該地區(qū)中有多少房東屬于低收入人群”，如下圖所示，該地區(qū)低收入人群越多，房?jī)r(jià)越低。

今天你低代碼了嗎？（低代碼是什么）

圖7 各個(gè)屬性對(duì)模型預(yù)測(cè)的影響力排名

鑒于可視化能給人們帶來(lái)最直觀的認(rèn)知，SageMaker Canvas中提供了可視化方法，來(lái)展示回歸模型預(yù)測(cè)的效果。

如下圖，可以看到針對(duì)波士頓房?jī)r(jià)數(shù)據(jù)集，預(yù)測(cè)房?jī)r(jià)和實(shí)際房?jī)r(jià)之間的對(duì)比圖。針對(duì)預(yù)測(cè)類問(wèn)題，SageMaker Canvas提供了均方根誤差（RMSE），如下圖所示，線條周圍紫色區(qū)域的寬度代表了RMSE的范圍，房?jī)r(jià)預(yù)測(cè)的值通常會(huì)落在這個(gè)范圍之內(nèi)。

今天你低代碼了嗎？（低代碼是什么）

3）小結(jié)

本次，在使用SageMaker Canvas預(yù)測(cè)房?jī)r(jià)的過(guò)程中，我們只需要給定輸入數(shù)據(jù)集，SageMaker Canvas就可以從中推演出指定目標(biāo)變量的可能結(jié)果。其他預(yù)測(cè)問(wèn)題，也能在SageMaker Canvas上實(shí)現(xiàn)。

四、總結(jié)

高昂的硬件價(jià)格、復(fù)雜軟件配置一直是阻礙初學(xué)者入門(mén) AI 的絆腳石，低代碼機(jī)器學(xué)習(xí)開(kāi)發(fā)平臺(tái)的問(wèn)世與推廣可謂是“碼盲人群”的一道曙光。通過(guò)低代碼功能，使用支持比 Python 編碼更快、更容易的模型操作的新的機(jī)器學(xué)習(xí)算法，變得讓人期待?？梢?jiàn)，在未來(lái)，即使是完全不具備機(jī)器學(xué)習(xí)知識(shí)的業(yè)務(wù)人員，也可以運(yùn)用機(jī)器學(xué)習(xí)模型高效解決業(yè)務(wù)上的實(shí)際問(wèn)題。

本文由 @麥地與詩(shī)人原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載

題圖來(lái)自u(píng)nsplash，基于CCO協(xié)議

版權(quán)聲明：本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)，該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容，請(qǐng)發(fā)送郵件至舉報(bào)，一經(jīng)查實(shí)，本站將立刻刪除。

贊 (0)

投稿用戶

低代碼開(kāi)發(fā)是什么？低代碼開(kāi)發(fā)平臺(tái)的優(yōu)勢(shì)及好處有哪些？（低代碼開(kāi)發(fā)平臺(tái)是什么意思）

上一篇 2024年1月11日 am10:34

低代碼和無(wú)代碼開(kāi)發(fā)平臺(tái)到底該怎么選？（低代碼無(wú)代碼開(kāi)發(fā)平臺(tái)通用能力要求）

下一篇 2024年1月11日 am10:50

項(xiàng)目合同管理基本原則(項(xiàng)目合同管理措施)

項(xiàng)目合同管理措施項(xiàng)目合同管理措施是項(xiàng)目管理中至關(guān)重要的一環(huán)，其目的是確保項(xiàng)目在預(yù)算、時(shí)間和質(zhì)量方面得到嚴(yán)格控制，并有效地維護(hù)項(xiàng)目團(tuán)隊(duì)之間的合作和溝通。以下是一些項(xiàng)目合同管理措施的…

科研百科 2024年9月1日
33 0
隱蔽工程影像資料-監(jiān)理實(shí)施細(xì)則-鐵路-工程（隱蔽工程影像資料范本）

隱蔽工程影像資料-監(jiān)理實(shí)施細(xì)則-鐵路-工程（隱蔽工程影像資料范本）第一章編制依據(jù) 1. 已批準(zhǔn)的《監(jiān)理規(guī)劃》; 2. 已批準(zhǔn)的《施工組織設(shè)計(jì)》及專項(xiàng)施工方案; 3. 已批準(zhǔn)的設(shè)…

科研百科 2024年3月28日
239 0
科研項(xiàng)目社會(huì)效益有哪些方面

科研項(xiàng)目的社會(huì)效益是多方面的。以下是一些常見(jiàn)的社會(huì)效益： 1. 促進(jìn)科學(xué)研究：科研項(xiàng)目可以推動(dòng)科學(xué)研究的發(fā)展，為人們提供更好的知識(shí)和技術(shù)。 2. 推動(dòng)經(jīng)濟(jì)發(fā)展：科研項(xiàng)目可以帶來(lái)技術(shù)…

科研百科 2024年11月6日
36 0
扶貧資金項(xiàng)目申報(bào)程序(扶貧資金項(xiàng)目管理系統(tǒng))

扶貧資金項(xiàng)目管理系統(tǒng)扶貧資金項(xiàng)目管理系統(tǒng)(簡(jiǎn)稱扶貧模式)用普通的國(guó)家語(yǔ)言開(kāi)發(fā)技術(shù),就是金融工程的起步。比如兩國(guó)蜀普聯(lián)合拳為國(guó)家制定了5000年前的國(guó)家工程管理?xiàng)l例,為國(guó)家提供最經(jīng)濟(jì)…

科研百科 2024年7月30日
53 0
大學(xué)科研獎(jiǎng)勵(lì)辦法

大學(xué)科研獎(jiǎng)勵(lì)辦法近年來(lái)，隨著大學(xué)教育越來(lái)越受到重視，科研活動(dòng)也越來(lái)越受到支持。為了鼓勵(lì)師生們積極開(kāi)展科研活動(dòng)，提高科研水平，許多大學(xué)都制定了相應(yīng)的科研獎(jiǎng)勵(lì)辦法。本文將介紹一些常見(jiàn)…

科研百科 2024年10月18日
38 0
工程進(jìn)度控制管理制度（工程進(jìn)度控制管理制度有哪些）

1、目標(biāo)：通過(guò)規(guī)范施工進(jìn)度管理，確保進(jìn)度計(jì)劃的有效執(zhí)行和進(jìn)度目標(biāo)的實(shí)現(xiàn)； 2、編制施工進(jìn)度計(jì)劃 2.1施工單位應(yīng)于第一次工地會(huì)后15天內(nèi)完成施工組織設(shè)計(jì)（包含采取網(wǎng)絡(luò)計(jì)劃技術(shù)編制的…

科研百科 2022年9月6日
329 0
科研項(xiàng)目撤銷(科研項(xiàng)目中途退出有什么影響)

科研項(xiàng)目中途退出有什么影響在參加科研項(xiàng)目的過(guò)程中，中途退出可能會(huì)對(duì)研究人員產(chǎn)生很大的影響。這可能會(huì)導(dǎo)致項(xiàng)目進(jìn)度的延誤，增加項(xiàng)目的成本，并且可能會(huì)影響項(xiàng)目的最終成果。因此，在參加科…

科研百科 2024年4月11日
415 0
【單位黨建創(chuàng)建做法】通用某局特色黨建品牌建設(shè)做法（創(chuàng)建黨建特色品牌實(shí)施方案）

單位黨建創(chuàng)建做法（通用某局特色黨建品牌創(chuàng)建做法某局將品牌理念貫穿于特色黨建工作品牌建設(shè)的始終，不斷彰顯特色、突出亮點(diǎn)、集中打造，讓創(chuàng)建過(guò)程轉(zhuǎn)化為黨員堅(jiān)守不忘初心，牢記使命，開(kāi)拓進(jìn)…

科研百科 2024年6月8日
62 0
人事績(jī)效考核系統(tǒng)，讓員工成為一名合格的高效管理者

人事績(jī)效考核系統(tǒng)，讓員工成為一名合格的高效管理者！長(zhǎng)期以來(lái)，員工績(jī)效考核信息管理都是依賴管理者人工進(jìn)行的，面對(duì)如此眾多的員工，只能靠管理者根據(jù)自身了解的信息對(duì)員工進(jìn)行評(píng)價(jià)考核?？?jī)…

科研百科 2023年5月24日
228 0
如何提升組織級(jí)項(xiàng)目管理能力

如何提升組織級(jí)項(xiàng)目管理能力組織級(jí)項(xiàng)目管理能力是指一個(gè)組織在管理其項(xiàng)目時(shí)所具備的技能和能力。一個(gè)好的組織級(jí)項(xiàng)目管理能力可以幫助組織實(shí)現(xiàn)其目標(biāo)，提高其效率，并減少項(xiàng)目失敗的風(fēng)險(xiǎn)。要…

科研百科 2024年9月21日
23 0

今天你低代碼了嗎？（低代碼是什么）

一、測(cè)評(píng)說(shuō)明

二、使用體驗(yàn)測(cè)評(píng)

1. 對(duì)沒(méi)有機(jī)器學(xué)習(xí)知識(shí)的人友好

2. 界面風(fēng)格簡(jiǎn)潔

三、功能測(cè)評(píng)

1. 分類問(wèn)題

2. 預(yù)測(cè)問(wèn)題

四、總結(jié)

相關(guān)推薦

今天你低代碼了嗎？（低代碼是什么）

一、測(cè)評(píng)說(shuō)明

二、使用體驗(yàn)測(cè)評(píng)

三、功能測(cè)評(píng)