Teknologi

LongCat 2.0 slog GPT-5.5 i kodning med kinesiske chips og ingen Nvidia

Susan Hill

LongCat 2.0 har 1,6 billioner parametre, behandler et kontekstvindue på en million tokens og har netop overgået GPT-5.5 fra OpenAI på det ledende benchmark for softwareudvikling i den virkelige verden. Det er bygget af Meituan — et selskab, som de fleste uden for Kina kender som en madleveringsapp, hvis de kender det overhovedet.

Modellen fik 59,5 på SWE-bench Pro mod GPT-5.5’s 58,6. Margenen ser lille ud, men det er konteksten, der gør præstationen bemærkelsesværdig: Meituan trænede LongCat 2.0 på over 50.000 kinesiske AI-acceleratorer — ingen Nvidia-hardware, som Kina ikke har kunnet importere i store mængder siden 2022. Producenten er ikke officielt bekræftet, men det tekniske miljø peger på Huawei Ascend 910B. Hvis det er korrekt, ville det være første gang, en model trænet på Huawei-chips, opnår grænseydelse i verificerbare offentlige benchmarks.

LongCat 2.0 anvender Mixture-of-Experts-arkitektur: kun 33 til 56 milliarder parametre aktiveres per forespørgsel, hvilket holder inferensen hurtig. Kontekstvinduet på en million tokens gør det muligt at indlæse en hel kodebase i én session. På SWE-bench Multilingual opnåede modellen 77,3; på Terminal-Bench nåede den 70,8.

Før den officielle lancering kørte modellen stille på OpenRouter under kodenavnet “Owl Alpha” i ca. to måneder. Udviklere, der brugte den, bemærkede dens usædvanlige kodningsevner, men vidste ikke, hvorfra den stammede. Meituan bekræftede efter lanceringen, at Owl Alpha var LongCat 2.0 i en tidlig evalueringsfase.

MIT-licensen fortæller kun en del af historien. Modelvægtene er endnu ikke offentliggjort — GitHub og Hugging Face siger begge “kommer snart”. Adgang sker foreløbig kun via en hostet API uden mulighed for download eller lokal kørsel.

Meituan behandler dagligt over 50 millioner madordrer og havde i det stille bygget en intern sprogmodel kaldet Zhichi. LongCat 2.0 er selskabets første offentlige model og, baseret på benchmarkresultater, et af de mest kapable kodningssystemer under åben licens.

Når vægtene frigives, konkurrerer LongCat 2.0 direkte med Metas Llama 4.1 og DeepSeek-V4 Pro. Bekræftelsen af, hvilke kinesiske chips der muliggjorde disse resultater, vil have konsekvenser langt ud over AI-verdenen.

Tags: , , , , ,

Debat

Der er 0 kommentarer.