【[新聞] Google壓縮技術可省記憶體大小達6X】PTT Stock 爆文精選

https://money.udn.com/money/story/5599/9403705?from=edn_newest_index Google發表了一種演算法並宣稱這技術能改善 AI 模型的記憶體使用效率。受此消息影響，記憶體晶片和儲存概念股周三全面下挫。美光股價跌3.4%，盤中一度大跌6.1%，連續五日下跌；Sandisk大跌 3.5%，連續四個交易日下跌。儲存裝置製造商希捷（Seagate）和威騰電子（Western Digital）股價周三各跌2.8% 和1.6%。亞洲記憶體股周四開盤也跟著重挫，三星電子和SK海力士各跌2.8%和3.4%。 Google周二晚上推出了 TurboQuant壓縮演算法，並說 TurboQuant不僅提升 AI 模型速度和效率，也能大幅減少記憶體使用量。這項演算法針對的是「向量」（vectors），其功能是協助 AI 模型理解並處理從簡單到複雜的資訊。Google 解釋說，高維度向量會消耗大量記憶體，進而在「鍵值快取」（KV cach e）產生瓶頸；而此快取技術正是讓 AI 模型能「記住」已處理過的資料，進而加快回應詢問速度的關鍵。雖然高維度向量可透過「向量量化」技術來壓縮，但 Google 說，這技術本身也會產生記憶體問題，因為需要計算和儲存額外數據，「這在某種程度上違背了向量量化的初衷。」Goog le 去年 4 月發表研究論文所提出的 TurboQuant，正是為了解決這個問題。記憶體和儲存裝置製造商先前因零組件短缺，能大幅調漲價格。如今，有投資人可能認為 A I 指標企業未來不再需要這麼多記憶體，削弱美光等供應商強大的定價權。但也有人認為事情沒那麼簡單，因為當技術進步降低了資源成本時，反而會因為資源變得更容易取得，進而推升了需求。 Google 說，其新型壓縮演算法能將 AI 模型的鍵值快取（KV cache）記憶體用量減少至少六倍，並將速度提升高達八倍，這實質上降低了「推論」（即執行 AI 模型）的成本。有分析師拿傑文斯悖論（Jevons paradox）解釋，這將帶動 AI 模型的普及，進而導致對記憶體更多的需求。 Lynx Equity Strategies發給客戶的報告中寫道：「Google 所詳述的方法，在未來 3 到 5 年內幾乎不會減少對記憶體和快閃記憶體的需求，因應供給極度受限，」這個研究機構重申了對美光 700 美元目標價；美光周二收盤價為 382美元。 =========== 難怪這幾天華邦跌破百了還在繼續跌旺宏直接躺平亮燈群聯見不到底的跌了再跌有潘董買自家股票的加持也沒用南亞科有私募基金的大話題加持一樣紅燈直下轉綠難怪廠務設備今天一起狂跌因為華爾街人認為只需要1/6記憶體的產線就夠用了不需要擴廠 Memory is over?? --

鄉民討論

1F ericf129 貼新聞都不會= =? 17:38

2F cuteSquirrel 樓下記憶體專家 17:38

3F amhs 蹦蹦 17:39

4F ppmaker 不可能絕對不可能，如果是真的我要跳了！！！ 17:39

5F kinve1014 宣稱嗯壓低吃貨囉 17:40

6F luche 記憶體廠商先制裁 17:40

7F thetide0512 你先OVER 17:41

8F tom77588 跟日本的壓縮機一樣稀少 17:42

9F pigu66 莫忘deepseek 17:42

10F tctv2002 狗家這麼厲害 17:42

11F LongBigShort 再囤啊 17:43

12F richardz 記憶體降下來絕對是消費者利多rrrr，終於可以開始 17:43

13F richardz 換電腦了嗎 17:43

14F lastsodeep 聽說舊的概念吧！而且一週下來goog好慘 17:45

15F stcr3011 有大神可解釋原理嗎想不透 17:45

16F s074074qq 投資人的錢包也被壓縮了 17:46

17F stcr3011 是減少快取的使用量嗎 17:46

18F appledick 這根本就沒影響 17:46

19F bobjohns 那google改賣記憶體豈不賺爛一條當六條賣那就全 17:47

20F bobjohns 市場記憶體全收來我賣6倍 17:47

市場相關情報

21F appledick 借機出貨而已 17:47

22F baolidab 我解釋一下原理：記憶體廠商吊高價，有人不爽，跟 17:47

23F baolidab 你翻桌。 17:47

24F baolidab 就是這樣XD 17:47

25F ice80712 Google and 記憶體 is over 17:47

26F bobjohns 那毛利直接突破天際 17:48

27F sdbb 跟衣物壓縮收納袋一樣 17:48

28F HarukaLM google一起跌... 17:48

29F Gaujing 總需求會上昇，降低單位成本，釋放更大需求，賣壓 17:48

30F kuominj 這兩個都一起over 17:48

31F Gaujing 那是在騙下車 17:48

32F stcr3011 os主記憶體量不會減少吧還是我才疏學淺 17:48

33F q8977452 說deepseek的 google的理論是前面的耶... 17:48

34F HGT7473 研究階段也能殺 17:48

35F Feting 跟這沒什麼關係，記憶體早幾天就開始走弱，單純要 17:48

36F Feting 開始套人 17:48

37F sdbb 空間變大只會塞更多的東西或衣物 17:49

38F horse2819 好的所以你技術開源嗎 17:49

39F mp5k6 這消息禮拜二就公布了你也太慢才知道了吧 17:50

40F Eide https://i.imgur.com/8yWNRCQ.jpeg 17:50

41F azure 線照跑股照跳一個循環提早結束回歸而已 17:50

42F tw19930419 公布幾天的事傻人多 17:50

43F ojh 估狗自己也崩爛了 17:50

44F xm3u4vmp6 需求會加大一般人終於買得起跑得動大模型 17:51

45F max0616 新聞沒貼全文 17:51

46F asjh612 google股價也是軟軟 17:51

47F ymx3xc 4G RAM的安卓機直接變旗艦24GB 17:52

48F zero790425 這個技術蠻重要的尤其現在上下文長度越來越吃記憶 17:53

49F zero790425 體 17:53

50F herculus6502 gpu cpu 重返農藥 17:53

51F furnaceh 用魔法優化魔法 17:53

52F Dazzium 不就deepseek 17:54

53F qxrvymo 不給活路 17:54

54F lobotime 一堆人的理解能力不在線 17:55

55F pkh1234 時間換空間算的夠快的話就不用那麼多記憶體 17:55

56F hensel 降到1/6，不就是要讓人薯條加大 context約吃越多嗎 17:55

57F orz811017 只會越用越多啦 17:56

58F jay3u7218 有這麼神嗎？？？ 17:57

59F YesNoter ai殺手 17:57

60F ga3322165 能塞越多，只會更貪婪懂得就懂 17:58

61F wiki67la 跟deepseek 一樣吃貨啦，就算壓縮，你ai量大，難道 17:58

62F wiki67la 就不需要記憶體嗎？ 17:58

63F foolwind 那不就可以賣6倍價格超爽的 17:58

64F AustinRivers winrar比較好用 17:58

65F hanklee66 那google這麼厲害怎麼沒漲… 17:58

66F CYL009 www 17:58

67F c928 然後變成智障AI 17:59

68F Waitaha Google是黑科技大本營 17:59

69F foolwind 原來的16G當96G在賣 17:59

70F tello 記憶卡蛙還有幾天可以逃 17:59

71F energy100203 ai需求很難變少捏 18:00

72F CCLemonn 可是估狗緩跌中 18:00

73F recruit GOOG盤前負的 18:00

74F hanklee66 不過按照過去經驗煤炭使用效率大幅提高結果反而是 18:01

75F hanklee66 更多人能用煤炭反而越用越多 18:01

76F joyeszhang 記憶卡蛙： 18:01

77F EdenEden 結果google股價超爛哈 18:01

78F heavensun 演算法沒哪麼神，這幾年AI爆發 94靠硬體支援算力 18:02

79F heavensun 記憶體趨勢不變大廠都認南亞科的私募惹 18:03

80F wu90315 演算法哪裡沒有那麼神？演算法是演算法，算力是算力 18:04

81F wu90315 ，完全不一樣的東西 18:04

82F Kewseq 完了教主的賣逼買mu 反指標嗎w 18:05

83F bobokeke 記憶體漲價就是通膨啊，哪有東西不用記憶體的 18:05

84F desion30 不是本來就有的東西嗎這個改版不是只多壓20%？ 18:05

85F h0103661 KV cache 佔總體大小10-20%而已，而且早就有相關的 18:07

86F h0103661 壓縮技術，這個只是號稱損耗比較低 18:07

87F andy79323 壓縮 kv cache在做上下文優化 18:07

88F andy79323 未來模型只會越大硬體book能縮 18:07

89F a11011788 能省還不加進去算爆？ 18:07

90F saiya 其實跟sndk沒關係吧 mu , sk , samsung 才有影響 18:07

91F tw19930419 那google還不噴到外太空傻子連市場都不信了 18:08

92F sdbb @andy79323 推book能，有梗 18:08

93F lightson 出貨什麼都可以說 18:09

94F yurmom 笑死拜託貸款做空記憶體 18:09

95F ntr203 google第幾次了每次人家炒什麼都要出來砸一下然 18:09

96F ntr203 後自己股價也不會漲 18:09

97F deepdish yoyodiy表示 18:09

98F gk1329 好誒 18:09

99F lightson deepseek相同故事而已 18:09

100F ntr203 上次也弄個什麼tpu 18:12

101F icelaw 這只是演算法理論值實際上去跑應該會打折不少 18:13

102F icelaw 實際上能少個兩成就很厲害了 18:14

103F budaixi https://i.imgur.com/cL3iHlx.jpeg 18:14

104F cerwvk 不可能無限記憶體使用,這技術很實在. 18:14

105F icelaw 但在目前記憶體吃緊的時候，能實際少個兩成使用量 18:15

106F icelaw 就貢獻很大了 18:15

107F TIPPK ddr5 16g 一條上看一萬 18:15

108F mnmnooo 嘿嘿，要用全都要跟我谷歌買授權 18:17

109F homygodpppk 效能變六倍不是超好 18:17

110F good10740 可以繞過嗎 18:18

111F taylorabc 你...別再....說了..... 18:18

112F ravelson 昨天晚上就有新聞在這板上，再來一次喔。 18:18

113F EdenEden 每次看誰好都要去搞結果自己也不好 18:19

114F jackz 早就該壓縮了 18:20

115F SQOneal 好厲害我要歐印Goog了 18:21

116F ilovebig99 壓縮再解壓縮不知道有沒有資訊遺失，而影響推論品質 18:21

117F ilovebig99 ？ 18:21

118F WWIII 崩。。。。。 18:22

119F yjjia 狗哥資料中心需要很多硬體，記憶體貴33，打下去節 18:22

120F yjjia 省成本 18:22

121F peace305 快跌多一點真的 18:22

122F Swave ZIP壓縮發明後硬碟需求有崩嗎? 沒有嘛! 18:23

123F dovepacket 壓縮到僅3位元？分類成8種就能處理？。以為是八 18:23

124F dovepacket 卦陣哦 18:23

125F strlen 壓了還是缺啊 18:23

126F jackz 效率化本來就是AI發展必定會有的阿 18:23

127F Swave 反而人類會用壓縮後的技術、節省的空間，做更多事 18:23

128F bcismylove 七傷拳的意思大家一起跌 18:24

129F speed364 你上ptt雙核心就夠了，為什麼要用10幾核？ 18:24

130F cool10528 所以google股價要飛天了吧？有嗎 18:24

131F George1118 記憶體娃集體壯膽 18:25

132F reall860523 開發新技術然後把記憶體股價帶下去就算了，自己股 18:25

133F reall860523 價也沒漲，神人公司 18:25

134F white1861 但Google股價沒漲？ 18:27

135F secrectlife 日本的壓縮機？ 18:28

136F Usmall857 上漲靠錢堆下跌靠風吹，完美詮釋XDD 18:28

137F qwe78971 Ai要取代工程師我看還久的連這種基本問題都沒辦 18:29

138F qwe78971 法還是要靠人 AI泡沫太明顯 18:29

139F j112233446 減少6倍就等於可以多塞6倍的context 啊 18:29

140F misthide 當前AI瓶頸就是記憶體產能當然要想辦法繞過去啊 18:29

141F misthide 總不能一直被記憶體大廠掐著脖子吧 18:30

142F owenxeve 單一記憶體效率變高但用一樣的量不是整體效率更好 18:31

143F owenxeve ？ 18:31

144F changkuany 谷狗是先殺低等歐洲的判決吧 18:32

145F apolloapollo 卡哇 over 18:36

146F tanby 只有影響推理部分而已 18:36

147F applejone 記憶體不嫌少的拉尤其是高速的 18:37

148F capcombio 便宜的記憶體買的到了嗎？ 18:39

149F karta018 才6倍，就算600倍記憶體產能還是遠遠不夠 18:43

150F sinsia 一起來壓低股價吃貨嗎 18:44

151F inzaghi0221 goog出來砸爛然後默默吃低價 18:46

152F jmcgow11 好了啦 google自己都沒有漲了 18:46

153F littlelaba 不可能絕對不可能 18:47

154F littleoldman 我怎麼感覺記憶體會更缺~~ 18:48

155F frank94 這本來就一直在卷的東西，就像過去的半導體，但需 18:48

156F frank94 求的增長還是超過卷的速度 18:48

157F attila125 這個演算法是免費的嗎? 18:50

158F tnksda 為跌找理由XD 18:51

159F davislin https://bely.cc/mMopjW 看看實作效果 18:51

160F nisi0773 google自己都沒漲了 18:51

161F shhs1000246 需求快速往地端推而已啦越搞越缺記憶體 18:51

162F stcr3011 Goog資料中心龐大一點優化都是量級 18:51

163F davislin https://i.verb.tw/7DlPgG9e.jpg 18:52

164F bypetty 三個月後再說沒辦法就笑死 18:52

165F a9564208 看起來是可以改搶DDR4, DDR5 18:53

166F schumi7401 一篇論文沒經過實體驗證讓記憶體市值掉了幾百億美 18:53

167F mercedeces 壓縮會降速耶,如果本來就壓縮,這可能就是一種新演算 18:56

168F mercedeces 法,但這跟消費電子應該沒關係 18:56

169F a9564208 之前狗家才說要改玩dram rack，搭配這個能成功那HB 18:56

170F a9564208 M要下去嗎 18:56

171F chachabo 狗狗自己都GG了 18:56

172F sustainer123 這甚至是一年前的論文== 18:58

173F greedypeople 我也覺得不一定記憶體就會利空新技術會帶來更多 19:03

174F greedypeople 應用場景跟商業機會 19:03

175F Giovann Google這項壓縮技術的論文 2025 4月已經公諸於世， 19:07

176F Giovann 這次只是在 Google Research blog 簡單的介紹效果。 19:07

177F stlinman 美劇《矽谷群瞎傳》(Silicon Valley)早就拍過了! 19:08

178F gotofumihisa 本來就在炒作缺不缺都嘛說說的連缺多少要幹嘛都講 19:08

179F Giovann 而且此類壓縮技術研究一直都不斷的被發表。 19:08

180F gotofumihisa 不出來 19:08

181F stlinman 革命性的數據壓縮算法啊! 19:08

182F bring777 需求量減少5/6，約減少83%，黑科技 19:08

183F sheep2009 老黃刀法來了 19:09

184F luweber88 聽說是個對HBM有用消費級的主機用不到也跑不起來？ 19:11

185F davislin oMLX三天前0.2.20還沒有，早上更新的0.2.21就加上 19:11

186F davislin 了，看上圖kv memory是省75%～80%，是比理論值1/6 19:11

187F davislin 差一點，但也很驚人了 19:11

188F redsaizu 用一個軟體模擬就說好厲害？請用一萬台AI伺服器測 19:12

189F redsaizu 試後再說吧 19:12

190F KY1998 你想多了，長上下文的任務只會多不會少 19:14

191F selvester 你先示範2G跑win11 19:14

192F xluds24805 記憶體本來就能用壓縮，真要壓縮絕對不只六倍 19:14

193F KY1998 這是因為人類處理慢慢轉變為AI處理 19:15

194F perlone 記憶體over 19:15

195F sheep2009 記憶體真over 有夠耗電 19:20

196F tshu 從dos到win11，你覺得記憶體用量是？以後到處是ai 19:24

197F tshu 與機器人，記憶體用量是？ 19:24

198F tshu 發明zip,rar，h.264 h.265之後，儲存用量有降低嗎 19:26

199F NTUT56 蛤，壓縮演算法不就那幾個，還可以玩出新花樣？全 19:27

200F NTUT56 都霍夫曼變一變而已不是 19:27

201F lpb 記憶體要跌回來了嗎？我有機會換新電腦了！ 19:31

202F neowfish 你是不是LAG兩天了 19:31

203F ship1228 記憶體 is over ，google沒在開玩笑 19:33

204F je789520 那也只有谷歌一家能用吧又不會拿出來分享 19:36

205F ai112039 少做一些狐狸醬板鴨記憶體就會輕鬆點 19:36

206F A80211ab 實在太讚了軟體終究是解方 19:43

207F chinoyan kv cache 能少,模型又不能少,一群不懂原理的過度反 19:43

208F chinoyan 應 19:43

209F domodesty 為什麼google 股價也還在跌??? 不懂 19:44

210F ravelson 遙想之前說美光沒在輝達HBM4供應商的新聞造成大跌 19:45

211F AbianMa19 真的還假的 19:45

212F ravelson 只能說，要讓跌就多出新聞，散戶自然就相信了。 19:45

213F joy2105feh 連自家股價都壓縮了 19:46

214F AbianMa19 少一狐狸醬板鴨島嶼天光應該就會降價 19:46

215F ravelson 這種招數百試不爽呢。 19:46

216F bambooxp 先把chrome記憶體壓縮吧 19:46

217F ppbro Google 真的跟鬼一樣 19:48

218F drrhythm 這樣對邊緣計算是利多吧，而且壓縮技術會公開 19:51

219F AAIOU 去年四月發表到現在，記憶體有比較不缺嗎 19:54

220F dadanyellow 記憶體風光過了，若真因此股價開始大幅回調，也不 19:57

221F dadanyellow 用太難過，大多數人心裡都明白這是遲早的 19:57

222F jalai 記憶體變便宜當然需要用更多短空長多 19:59

223F romusutoru 3-5年…… 20:01

224F MizPerfect 這是給 GOOG 那群阿三costdown用的 20:02

225F MizPerfect 你能忍受問個GEMINI一句話結果五分鐘回答你嗎? 20:03

226F s8900117 糕點到了 20:11

227F cct1121 有趣了 20:19

228F g9122xj 這是經濟學裡的技術進步，不是供給需求的問題，是AI 20:22

229F g9122xj 更多元應用的技術，只要他不是取代記憶體，我相信這 20:22

230F g9122xj 只會加速AI應用的爆發，記憶體再跌我就去撿一些 20:22

231F eemail 人家說減少使用,結果有人講難道不用,零分 20:23

232F wsa28 Google真是AI巨頭裡面最強的 20:25

233F ksjr Google又又又又又又又要設計新tpu了嗎 20:26

234F saiya 載入模型的記憶體還是沒變，這個技術主要是在壓縮上 20:30

235F saiya 下文的，也就是可以再塞更多上下文進去，跟省記憶體 20:30

236F saiya 沒關係，需要128g才能載入的模型還是需要128g 20:30

[新聞] Google壓縮技術可省記憶體大小達6X

今日當沖客都在研究的熱門覆盤

鄉民討論