開源模型新霸主登場!1兆參數Kimi K2寫程式比GPT-4.1強
開源模型新霸主登場!1兆參數Kimi K2寫程式比GPT-4.1強

開源模型新霸主登場!1兆參數Kimi K2寫程式比GPT-4.1強

開源模型 Kimi K2 採用 Mixture of Experts(MoE)架構,擁有高達 1 兆參數卻在每次推論僅啟用約 320 億參數,以達到知識廣度與運算效率兼具的效果;它在 15.5 兆詞彙規模的預訓練下展現出強大的程式碼生成能力,於 Live Code Bench 評測中取得 Pass@1 達 53.7%,顯著優於 GPT-4.1 的 44.7%;同時支援智能體式工具呼叫,能自主規劃步驟並整合計算機、搜尋引擎及第三方 API,實現工作流程自動化;其低延遲 “Reflex Grade” 回應體驗與長文本風格一致性,結合開放且寬鬆的修改後 MIT 授權,為開發者與企業提供高度可試用與可整合的全新智能協作機會。

Continue Reading 開源模型新霸主登場!1兆參數Kimi K2寫程式比GPT-4.1強
DeepSeek 大型語言模型於硬體平台上高速運算關鍵條件與展望報告
DeepSeek 大型語言模型於硬體平台上高速運算關鍵條件與展望報告

DeepSeek 大型語言模型於硬體平台上高速運算關鍵條件與展望報告

主要探討了 NPU 與 GPU 兩大平台在低精度運算、模型架構硬體友好性、內存與數據流管理、專用軟體生態與工具鏈支援以及協同優化算法等面向的技術挑戰與成熟度評估,指出目前 NPU 的各項技術約介於 3 至 4 分之間,相較之下 GPU 則因其完善的軟硬體生態已達 5 分水準,預計 NPU 若要全面追平需約 3 至 5 年的技術進步;此外,報告亦針對 DeepSeek 結合 Ollama 平台在 AMD 消費級 GPU 上進行推論運算的實際表現進行比較,發現其運行穩定但效能普遍比 Nvidia 同級產品低約 10% 至 20%,整體呈現出未來隨著生態與工具優化,無論在邊緣運算還是商用應用上,都有望達到更省電、高效能的運算表現​。

Continue Reading DeepSeek 大型語言模型於硬體平台上高速運算關鍵條件與展望報告
實務解析自家部署 DeepSeek R1:7b~671b 模型 GPU 配置成本與安全可控策略探討
實務解析自家部署 DeepSeek R1:7b~671b 模型 GPU 配置成本與安全可控策略探討

實務解析自家部署 DeepSeek R1:7b~671b 模型 GPU 配置成本與安全可控策略探討

本文在探討自家部署 DeepSeek R1 模型從 7b 到 671b 規模下的 GPU 配置、成本評估與安全可控策略,文中以實際應用需求與個資安全為出發點,闡述雲端運算雖便利卻隱含風險,故愈來愈多使用者選擇自家硬體部署以達到數據全程掌控與靈活硬體更新,同時從 RTX 系列到頂級 A100 的 GPU 配置推估,並以開源軟體工具組合輔助整體運算效能,最後強調在面對 AI 大潮與市場利空消息的情境下,自家部署不僅有助於降低長期成本,亦能提供更高的資料安全保障,是企業與個人應對未來 AI 運算需求的可行解決方案。

Continue Reading 實務解析自家部署 DeepSeek R1:7b~671b 模型 GPU 配置成本與安全可控策略探討
全球5大科技公司AI算力與營收項目推論報告書
全球5大科技公司AI算力與營收項目推論報告書​

全球5大科技公司AI算力與營收項目推論報告書

本文探討生成式人工智慧的快速發展背景下,全球五大科技公司(Google、微軟、Meta、亞馬遜、xAI)對AI算力的需求變化,並分析Nvidia最新推出的GB200超級芯片對市場的影響。GB200具備推論速度提升30倍、能效提高、架構創新等優勢,對AI模型的訓練和運行成本顯著降低。報告指出,這些科技公司若採用GB200,其算力效能將至少提升15倍,進一步優化生成式AI應用、廣告優化、雲端服務、內容生成及元宇宙部署等領域的營收策略。同時,GB200的低能耗設計和高效能有助於推動AI技術的落地,但面臨晶片產能和競爭加劇的挑戰。展望未來,GB200將重新定義AI市場競爭格局,加速全球AI生態系統的發展,並提升科技公司在生成式AI領域的市場領導地位。

Continue Reading 全球5大科技公司AI算力與營收項目推論報告書
2024 Nvidia GTC 演講影片字幕繁體中文重點摘要 (24項重點)
俏皮可愛的 AI 馬斯克

2024 Nvidia GTC 演講影片字幕繁體中文重點摘要 (24項重點)

2024年Nvidia GTC全球開發者大會精彩亮點包括數據中心現代化、生成式AI的崛起、Blackwell電腦、Nims軟體分發新方式等。大會展示了未來機器人技術的蓬勃發展,尤其是數字孿生平台Omniverse將成為機器人世界的操作系統。Nvidia創始人兼CEO Jensen Huang將Nvidia定位為一個願景公司,覆蓋從輔助生活到生成虛擬場景探索真實世界等多個領域。CUDA技術和AI的結合開創了AI的新紀元,而Nvidia的DGX-1 AI超級電腦更是促進了AI領域的發展。

Continue Reading 2024 Nvidia GTC 演講影片字幕繁體中文重點摘要 (24項重點)

End of content

No more pages to load