Beheerde modellen
Modellen die vandaag beschikbaar zijn in Digio
Wijs een standaardmodel toe per agent of overschrijf per taak. Het gebruik wordt gemeten in Digio Tokens op basis van uw abonnementssaldo: dezelfde portemonnee, ongeacht of de agent Sonnet, GPT-4o of Gemini Flash belt.
Antropische Claude
-
Claude Opus 4.7
Vlaggenschipredenering, lange context, architectuur en strategiewerk.
-
Claude Opus 4.6
Opus van de vorige generatie voor stabiele, hoogwaardige analyses.
-
Claude Sonnet 4.6
Dagelijkse driver: coderen, schrijven en agentloops in meerdere stappen.
-
Claude Sonnet 4.5 / 4
Snelle Sonnet-lagen met snelle caching op ondersteunde workloads.
-
Claude Haiku 4.5
Concepten, classificatie en subtaken met een hoog volume met lage latentie.
B2B SaaS-website UI-label. Vertalen naar natuurlijke nl: OpenAI
-
GPT-5.5 / GPT-5.4 / GPT-5.2
Nieuwste GPT-5-familie voor algemene en agentische workloads.
-
GPT-4.1 & GPT-4o
Betrouwbaar multimodaal chat- en toolgebruik voor productieagenten.
-
GPT-4o mini
Kostenefficiënte routering voor samenvattingen en lichtgewicht stappen.
-
o3 / o3-pro / o3-mini / o4-mini
Op redeneren gerichte modellen voor wiskunde, planning en verificatie.
-
GPT-5.3 Codex & Codex mini
Codegeneratie, refactoren en repo-bewuste agentvaardigheden.
Google Tweelingen
-
Gemini 2.5 Pro
Lange-contextonderzoek en gestructureerde extractie.
-
Gemini 2.5 Flash
Agentstappen met hoge doorvoer en concurrerende tokentarieven.
-
Gemini 2.0 Flash
Ultrasnelle doorgangen voor parseren, taggen en batchtaken.
Open en gespecialiseerde API's
-
DeepSeek Chat & Reasoner
Sterke waarde voor taken in chat- en denkketenstijl.
-
Mistral Large
Door Europa gehoste optie voor meertalige agententeams.
-
Llama 3.3 70B
Klassenmodel met open gewichten via API: past goed bij privé-GPU.
-
Grok 3
Real-time georiënteerd model voor nieuws- en sociale monitoringagenten.
-
Sonar Pro
Op zoek gebaseerde antwoorden voor onderzoeksagenten.
-
Command R+
RAG-vriendelijke zakelijke chat- en ophaalworkflows.
Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in
pricing.
-
1
GPU reserveren
Kies VRAM, regio en uptime (burst versus altijd aan). Opslag voor gewichten wordt meegeleverd met de instance of bevestigt uw emmer.
-
2
Implementeer de stapel
Start een serveerimage of SSH in, installeer CUDA-stuurprogramma's en laad controlepunten. Gezondheidscontroles bevestigen dat het model gereed is.
-
3
Eindpunt registreren
Voeg basis-URL, API-sleutel en model-ID toe in de werkruimte-instellingen. Digio valideert de latentie en het tokenformaat voordat het live gaat.
-
4
Toewijzen aan agenten
Kies uw privémodel als standaard voor geselecteerde agenten; beheerde Claude/GPT-modellen blijven naast elkaar beschikbaar.
GPU-huur wordt afzonderlijk van Digio-abonnementsabonnementen gefactureerd. Neem contact met ons op voor capaciteitsplanning, SLA's en migratie vanuit een bestaand inferentiecluster.