她用滑鼠圈出來,「這幾行。」
不知道是因為嘴裡有糖,還是因為不想跟慕留說話,她的嘴張得不夠開,聲音有點含混。
「嗯,」慕留斂了笑意,認真地問她,「詞向量維度100是什麼意思?」
「詞向量里有100個元素。」
「對,具體說是有一個向量空間,它有100個維度,我們把這個詞映射到這個空間裡,得到了100個坐標。同一個詞在不同維度的表現可能差異很大,舉個例子,」慕留對著屏幕想了兩秒,「比如『小牛』和『小羊』。」
楊枝用餘光瞟了他一眼,沒出聲。
「在一個和動物有關的維度上,『小牛』和『小羊』可能會表現得很相似,浮點數很接近,但是在別的維度,比如地理位置,或者是一個不可解釋的維度上,『小牛』和『小羊』可能就會表現得差異很大,相關性很低。所以維度越高,捕捉到的詞語關係就會越准。」
楊枝「嗯」了一聲。
慕留說到這裡,開始一邊敲代碼一邊講:「這裡它設定的維度是50,其實是很低的維度。但是它想把詞向量可視化,可視化的話維度50還是太高,一般是2或者3。」
他扭頭看向楊枝,「所以要怎麼辦?」
楊枝看向屏幕,「降維。」
「對,」慕留把頭轉回去,「降維有幾種辦法,它這裡用的是tsne算法,所以加了一個rtsne的包,後面這兩個參數,dims就是維度,theta你可以理解成一個加快計算速度的參數,一般在0到1之間取,它取了0.1,這個值比較小,所以計算速度就比較慢,但是算得更精確。」
手指適時按下兩個井號,把他說的一些重點寫成注釋。
她提問:「可以取到0和1嗎?」
「可以,取到0的時候結果最精確,取到1的時候算得最快。還有哪裡沒聽懂嗎?」
楊枝含著糖搖搖頭。
「那我繼續了?」
楊枝含著糖點點頭。
慕留把可視化的函數敲完,楊枝的糖也吃完了,只剩下最後一步,設置圖表的格式。
「這個圖應該挺密集的,想要什麼顏色?」慕留問楊枝。
是很密集,滿眼的鮮紅色小點,她回想起來都頭皮發麻。
「藍色吧。」
慕留輸入「darkblue」,又在鍵盤上敲了幾下,把電腦推到楊枝面前,「你運行一下。」
楊枝心道,怎麼越不想看,他還越讓她看。
她做好心理準備接受視覺攻擊,不情願地運行了代碼。
屏幕右下角出現了一張深藍色點狀圖,效果遠沒有她之前看到的那麼不適,因為顏色從中心到邊緣漸變。
還挺好看的。
「我講明白了嗎?」
「明白了。」
楊枝瞧著慕留,不知道自己現在該幹什麼。
見她沒動靜,慕留笑了一聲,「幹什麼,你還想給我再講一遍?程唯的微信里可不包括這項。」
他像完成了一項工作似的,人往椅背上一靠,悠閒地看起了手機。
楊枝的耳邊突然安靜下來。
她好久好久沒聽過他講這麼多話。
音色低了一點,發音吐字也更標準了。不再像以前那樣,一定要把人講會了,更像他一開始給她講題的時候。
本站提供的小说版权属于作者,所有小说均由网友上传,如无意中侵犯了您的权利,请与我们联系,将在第一时间删除!
Copyright 2024赞中文网 All Rights Reserved