Model VibeThinker-3B z 3 mld parametrów dorównuje znacznie większym systemom AI w matematyce i kodowaniu
Chińska firma Sina Weibo wypuściła otwarty model językowy VibeThinker-3B, który mimo zaledwie 3 miliardów parametrów osiąga wyniki porównywalne z modelami DeepSeek V3.2 i Kimi K2.5 — nawet 333 razy większymi — w testach z matematyki i kodowania. Kluczem do sukcesu jest wieloetapowe szkolenie po treningu wstępnym, a nie rozmiar modelu. Badacze stawiają hipotezę, że logiczne rozumowanie dobrze "kompresuje się" do małych modeli, natomiast szeroka wiedza o świecie już nie.
Komentarze
Jeszcze nikt nie skomentował — napisz pierwszy 👇
Brak komentarzy. Bądź pierwszy!