首页 香波之外 书架
设置 书页
A-24A+
默认
第12頁
上一章 目录 书签 下一页

她用滑鼠圈出來,「這幾行。」

不知道是因為嘴裡有糖,還是因為不想跟慕留說話,她的嘴張得不夠開,聲音有點含混。

「嗯,」慕留斂了笑意,認真地問她,「詞向量維度100是什麼意思?」

「詞向量里有100個元素。」

「對,具體說是有一個向量空間,它有100個維度,我們把這個詞映射到這個空間裡,得到了100個坐標。同一個詞在不同維度的表現可能差異很大,舉個例子,」慕留對著屏幕想了兩秒,「比如『小牛』和『小羊』。」

楊枝用餘光瞟了他一眼,沒出聲。

「在一個和動物有關的維度上,『小牛』和『小羊』可能會表現得很相似,浮點數很接近,但是在別的維度,比如地理位置,或者是一個不可解釋的維度上,『小牛』和『小羊』可能就會表現得差異很大,相關性很低。所以維度越高,捕捉到的詞語關係就會越准。」

楊枝「嗯」了一聲。

慕留說到這裡,開始一邊敲代碼一邊講:「這裡它設定的維度是50,其實是很低的維度。但是它想把詞向量可視化,可視化的話維度50還是太高,一般是2或者3。」

他扭頭看向楊枝,「所以要怎麼辦?」

楊枝看向屏幕,「降維。」

「對,」慕留把頭轉回去,「降維有幾種辦法,它這裡用的是tsne算法,所以加了一個rtsne的包,後面這兩個參數,dims就是維度,theta你可以理解成一個加快計算速度的參數,一般在0到1之間取,它取了0.1,這個值比較小,所以計算速度就比較慢,但是算得更精確。」

手指適時按下兩個井號,把他說的一些重點寫成注釋。

她提問:「可以取到0和1嗎?」

「可以,取到0的時候結果最精確,取到1的時候算得最快。還有哪裡沒聽懂嗎?」

楊枝含著糖搖搖頭。

「那我繼續了?」

楊枝含著糖點點頭。

慕留把可視化的函數敲完,楊枝的糖也吃完了,只剩下最後一步,設置圖表的格式。

「這個圖應該挺密集的,想要什麼顏色?」慕留問楊枝。

是很密集,滿眼的鮮紅色小點,她回想起來都頭皮發麻。

「藍色吧。」

慕留輸入「darkblue」,又在鍵盤上敲了幾下,把電腦推到楊枝面前,「你運行一下。」

楊枝心道,怎麼越不想看,他還越讓她看。

她做好心理準備接受視覺攻擊,不情願地運行了代碼。

屏幕右下角出現了一張深藍色點狀圖,效果遠沒有她之前看到的那麼不適,因為顏色從中心到邊緣漸變。

還挺好看的。

「我講明白了嗎?」

「明白了。」

楊枝瞧著慕留,不知道自己現在該幹什麼。

見她沒動靜,慕留笑了一聲,「幹什麼,你還想給我再講一遍?程唯的微信里可不包括這項。」

他像完成了一項工作似的,人往椅背上一靠,悠閒地看起了手機。

楊枝的耳邊突然安靜下來。

她好久好久沒聽過他講這麼多話。

音色低了一點,發音吐字也更標準了。不再像以前那樣,一定要把人講會了,更像他一開始給她講題的時候。

上一章 目录 书签 下一页
首页 书架 足迹