歡迎訪問易龍三維科技官網,專注研發數碼打印機20年!
全國咨詢熱線:400-8316492
聯系我們
400-8316492

手機:13823737137

郵箱:3485053954@qq.com

QQ:3485053954

地址:深圳市龍崗區橫坪公路89號數字硅谷E棟4樓

當前位置:首頁 > 行業新聞 > 行業資訊

三家美國巨頭同日接入DeepSeek,業內人士:DeepSeek或準備適配國產GPU

時間:2025-02-02 02:27:22 作者:147小編 點擊:

undefined
undefined
undefined
undefined
undefined

undefined

 

盡管春節假期已然過半,然則“來自東方的奧秘力量的 DeepSeek”仍在導致全世界熱榜,各路業內人士仍在從區別方向分析 DeepSeek 的模型和技術文案。

北京時間1月31日,英偉達宣布DeepSeek-R1模型登陸NVIDIANIM。同一時段內,亞馬遜和微軟接入DeepSeek-R1模型。英偉達叫作,DeepSeek-R1是最先進的大語言模型。

韓國 Mirae Asset Securities Research 的一名分析師在 X 撰寫長文分析叫作:“這一突破是經過實施海量細粒度優化和運用英偉達的匯編式 PTX 編程,而非經過英偉達 CUDA 中的某些功能來實現的?!?/span>

源自:X)

便是說 DeepSeek 在開發大模型時繞過了 CUDA。CUDA(Compute Unified Device Architecture,統一計算架構),是由于英偉達研發的一種通用編程框架,它準許研發者利用英偉達的圖形處理器(GPU,Graphics Processing Unit)進行通用計算。

倘若 DeepSeek 真的繞過了 CUDA,那樣這能說明什么?

在 DeepSeek-V3 的技術博文中,DeepSeek 暗示運用了英偉達的 PTX(Parallel Thread Execution)語言。

假如 DeepSeek 的研發者能夠很好地運用 PTX(Parallel Thread Execution)語言,那樣相比運用 CUDA 供給的編程接口,肯定能夠更精細地掌控 GPU 之間傳輸數據、權重和梯度等。然則,運用 PTX 寫出來的代碼非常繁雜,且很難守護,因此呢需要專業度較高的研發者。

源自:DeepSeek)

便是說,繞過 CUDA 的做法擁有必定的技術難度,這需要研發者既要懂 AI 模型的算法,又要懂計算機系統架構來有效分配硬件資源。倘若同期把握這兩方面技能的研發者,那就要分別招聘懂這些技能的研發者,即需要協調好區別人員。

從 DeepSeek 的技術報告來看,其主體實現還是基于 CUDA 的關聯接口,其描述中闡述繞開了 CUDA 來寫通信,那就寓意著它招聘了把握區別技能的人才,并能將這些人才很好地串了起來。

說明 DeepSeek 持有有些善于寫 PTX 語言的內部研發者。那樣,假如它之后運用國產 GPU,其在硬件適配方面將會更得心應手,其只要認識這些硬件驅動供給有些基本函數接口,就能夠仿照英偉達 GPU 硬件的編程接口去寫關聯的代碼,從而讓自家大模型更加容易適配國產硬件。

與此同期,從 DeepSeek 的技術報告來看,其技術從學術科研方向勝出一籌,然則在工程上面的確非常有技巧。思慮到 AMD 已然宣布集成DeepSeek-V3到 MI300X GPU,因此呢將來不排除會有更加多 GPU 廠商牽手 DeepSeek。

同期正如以上韓國分析師在同一篇 X 文案中所說的:“這凸顯了DeepSeek非凡的工程水平,并顯示美國對華制裁加劇的“GPU 短缺危險“激發了她們緊迫感和創造力。“

源自:大象資訊、深科技

▌編輯:趙珊珊 校對:湯琪返回外鏈論壇: http://www.fok120.com,查看更加多

  • 免責聲明:部分文章信息來源于網絡以及網友投稿,本網站只負責對文章進行整理、排版、編輯,是出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其內容的真
  • 實性,如本站文章和轉稿涉及版權等問題,請作者在及時聯系本站,我們會盡快刪除處理問答,若不聯系則默認允許本站轉載。
  • 上一篇:《蛟龍行動》上映第4天票房僅1.9億!演員于適借用電影角色原話發聲:咱們只想要公平
  • 下一篇:三五個人的宣傳加工廠,年產值幾百萬,這般的UV生意你仰慕嗎?