Meta mobilizon dhoma të shumta lufte të inxhinierëve për të deshifruar kërkimin e thellë dhe zbulimin me kosto efektive

Koha e parashikuar e leximit: 2 minuta

31 janar 2025

Meta thuhet se ka mobilizuar katër ‘dhoma lufte’ të dedikuara inxhinierike për të analizuar qasjen novatore të DeepSeek ndaj zhvillimit të AI. Modeli R1 i startup-it kinez, i cili thuhet se kushtoi vetëm 5.58 milionë dollarë për t’u trajnuar duke përdorur 2048 çipa Nvidia H800, ka arritur metrika të performancës që përputhen ose tejkalojnë ato të modeleve kryesore amerikane që kushtojnë miliarda për t’u zhvilluar.

Urgjenca e përgjigjes së Metës rrjedh nga shqetësimet e brendshme që Modeli i DeepSeek mund të jetë më i mirë se publikimi i tyre i ardhshëm në Llama. Duke përdorur teknika të sofistikuara optimizimi dhe motorë të specializuar konkluzionesh, DeepSeek përfundoi trajnimin e tyre në më pak se dy muaj, duke kërkuar vetëm 2.79 milionë orë GPU – një pjesë e vogël e asaj që kompanitë amerikane përdorin zakonisht.⁠⁠

Shkencëtarikryesor i AI i Meta, Yann LeCun, e cilëson këtë ndërprerje si vërtetim të supremacisë së burimit të hapur dhe jo të një konkurrence SHBA-Kinë. DeepSeek u ndërtua mbi punën ekzistuese me burim të hapur, duke përfshirë PyTorch dhe Llama të Metës, duke demonstruar se si kërkimi i përbashkët mund të përshpejtojë inovacionin. Përparimi i tyre sfidon supozimin se zhvillimi i avancuar i AI kërkon investime masive në infrastrukturë, duke riformuar potencialisht të ardhmen e industrisë.

Postime të ngjashme