Do I pay twice—plan plus API?

Your Digio subscription covers infrastructure, agents, and included Digio Tokens. Managed model usage debits that token balance by actual input/output tokens. GPU rental is an add-on for the machines you control.

Can different agents use different models?

Yes—each agent can have its own default. Tasks and chats can override for a single run without changing the global default.

What is the difference between Sonnet and Opus?

Opus is tuned for harder reasoning and longer coherent plans; Sonnet is faster and cheaper for everyday agent loops. Haiku and flash-class models are best for volume subtasks.

Can I run only my own model and block cloud APIs?

Enterprise workspaces can restrict outbound model providers and route all agent traffic to your GPU endpoint. Hybrid mode is the default for most teams.

Which GPU sizes are available?

Offerings depend on region and demand—commonly 24–80 GB VRAM tiers for 7B–70B class models and multi-GPU nodes for larger stacks. We help size VRAM from your parameter count and quantization.

Does private GPU usage still consume Digio Tokens?

Orchestration (agents, tasks, storage) stays on your plan. Inference on your GPU is billed as GPU time; you may optionally meter token-shaped usage for internal chargeback.

Digio ենթակառուցվածք

AI մոդելներ և GPU

Գործարկեք գործակալներին այսօր կառավարվող սահմանային մոդելներով, կամ վարձեք GPU-ի հզորությունը, տեղադրեք ձեր սեփական կշիռները և ուղղորդեք Digio-ի առաջադրանքները դեպի մասնավոր վերջնակետեր նույն աշխատանքային տարածքում:

Կլոդ, GPT, Երկվորյակ Գործակալի մոդելի ընտրություն GPU-ի վարձույթ և BYOM

Ստեղծեք աշխատանքային տարածք Պլաններ և նշաններ

Կառավարվող մոդելներ

Մոդելները հասանելի են այսօր Digio-ում

Յուրաքանչյուր գործակալի համար նշանակեք լռելյայն մոդել կամ անտեսեք յուրաքանչյուր առաջադրանք: Օգտագործումը չափվում է Digio Tokens-ում ձեր պլանի մնացորդից՝ նույն դրամապանակից՝ անկախ նրանից, որ գործակալը կանչում է Sonnet, GPT-4o կամ Gemini Flash:

Անթրոպիկ Կլոդ

Claude Opus 4.7 Առաջնային հիմնավորում, երկար համատեքստ, ճարտարապետություն և ռազմավարական աշխատանք:
Claude Opus 4.6 Նախորդ սերնդի Opus կայուն, բարձրորակ վերլուծության համար:
Claude Sonnet 4.6 Ամենօրյա դրայվեր՝ կոդավորում, գրելու և բազմաքայլ գործակալի օղակներ:
Claude Sonnet 4.5 / 4 Սոնետի արագ մակարդակներ՝ աջակցվող ծանրաբեռնվածությունների վրա արագ պահումով:
Claude Haiku 4.5 Ցածր լատենտային սևագրեր, դասակարգում և մեծ ծավալով ենթաառաջադրանքներ:

Բառացի թարգմանել. OpenAI

GPT-5.5 / GPT-5.4 / GPT-5.2 Վերջին GPT-5 ընտանիքը ընդհանուր և գործակալական ծանրաբեռնվածության համար:
GPT-4.1 & GPT-4o Հուսալի մուլտիմոդալ զրույց և գործիքների օգտագործում արտադրական գործակալների համար:
GPT-4o mini Ամփոփումների և թեթև քայլերի համար ծախսարդյունավետ երթուղի:
o3 / o3-pro / o3-mini / o4-mini Պատճառաբանության վրա հիմնված մոդելներ մաթեմատիկայի, պլանավորման և ստուգման համար:
GPT-5.3 Codex & Codex mini Կոդերի ստեղծում, ռեֆակտորներ և ռեպո-տեղեկացված գործակալի հմտություններ:

Բառացի թարգմանել. Google Gemini

Gemini 2.5 Pro Երկար համատեքստի հետազոտություն և կառուցվածքային արդյունահանում:
Gemini 2.5 Flash Բարձր արտադրողականության գործակալի քայլերը մրցակցային նշանների դրույքաչափերով:
Gemini 2.0 Flash Գերարագ փոխանցումներ վերլուծության, հատկորոշման և խմբաքանակային աշխատանքների համար:

Բաց և մասնագիտացված API-ներ

DeepSeek Chat & Reasoner Ուժեղ արժեք զրույցի և մտքի շղթայական առաջադրանքների համար:
Mistral Large Եվրոպական հյուրընկալվող տարբերակ բազմալեզու գործակալների թիմերի համար:
Llama 3.3 70B Open-weights դասի մոդելը API-ի միջոցով՝ լավ համակցված մասնավոր GPU-ի հետ:
Grok 3 Իրական ժամանակում կողմնորոշված մոդել նորությունների և սոցիալական մոնիտորինգի գործակալների համար:
Sonar Pro Որոնողական հիմնավորված պատասխաններ հետազոտական գործակալների համար:
Command R+ RAG-ի համար հարմար ձեռնարկությունների զրույցի և որոնման աշխատանքային հոսքեր:

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

Օգտագործումը

Ինչպես են գործակալներն ընտրում մոդել

Համակարգողը կարող է առաջարկել Sonnet vs Opus vs ավելի էժան ֆլեշ մոդել՝ հիմնված առաջադրանքի տեսակի վրա: Հզոր օգտվողները սահմանում են լռելյայններ յուրաքանչյուր գործակալի դերի համար՝ հետազոտություն Sonnet-ում, վերջնական վերանայում Opus-ում, զանգվածային հատկորոշում Haiku-ում կամ Gemini Flash-ում:

Per agent — default model in agent settings; override in To do or chat when needed.
Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).
Skills stay the same — tools and integrations work across models; only latency and cost profile change.
Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU-ի վարձույթ

Վարձեք GPU և գործարկեք ձեր սեփական մոդելները

Հարկավոր է ճշգրտման, օդային բաց անցակետի կամ կանխատեսելի եզրակացության գնի կարիք: Ավելացրեք հատուկ GPU հզորություն ձեր Digio աշխատանքային տարածքին, տեղադրեք ձեր նախընտրած սպասարկող փաթեթը և մատնանշեք գործակալները ձեր մասնավոր վերջնական կետում:

Նվիրված ատյաններ

Ժամային կամ ամսական GPU հանգույցներ (A100, H100, L40S դասի) կցված ձեր վարձակալին՝ մեկուսացված այլ հաճախորդներից:

Ձեր կշիռները

Վերբեռնեք պաշտպանիչ սարքեր, GGUF կամ հանեք ձեր ռեեստրից. գործարկել Llama, Mistral, Qwen և մաքսային նուրբ մեղեդիներ:

Ստանդարտ մատուցում

vLLM, TGI, Ollama կամ կոնտեյների պատկերներ, որոնք դուք պահպանում եք. Digio գործակալները կոչում են OpenAI-ի հետ համատեղելի բազային URL:

Նույն նվագախումբը

Անելու համար թիմային զրույցը, հմտությունները և համագործակցությունը անփոփոխ են՝ միայն եզրակացության հետին պլանը ձերն է:

Հիբրիդային երթուղի

Ուղարկեք զգայուն քայլեր մասնավոր GPU-ին և օգտագործեք Claude կամ GPT հանրային հետազոտությունների համար մեկ աշխատանքային հոսքի մեջ:

Ձեռնարկությունների վերահսկում

VPC ստուգում, ստատիկ ելք, աուդիտի տեղեկամատյաններ և կարգավորվող թիմերի մոդելային թույլտվությունների ցուցակներ:

Բերե՛ք ձեր սեփական մոդելը

Տեղադրեք և միացրեք հատուկ մոդել

Տիպիկ կարգավորում զրոյից մինչև ձեր վերջնակետը կանչող գործակալները.

Պահպանեք GPU-ն

Ընտրեք VRAM-ը, տարածաշրջանը և գործարկման ժամանակը (պայթել ընդդեմ միշտ միացված): Քաշի պահեստը առաքվում է ձեր դույլի օրինակով կամ ամրացմամբ:
Տեղադրեք կույտը

Սկսեք սպասարկող պատկեր կամ SSH, տեղադրեք CUDA դրայվերներ և բեռնեք անցակետերը: Առողջական ստուգումները հաստատում են, որ մոդելը պատրաստ է:
Գրանցեք վերջնակետը

Աշխատանքային տարածքի կարգավորումներում ավելացրեք բազային URL, API բանալի և մոդելի ID: Digio-ն հաստատում է ուշացումն ու նշանի ձևաչափը՝ ուղիղ եթեր դուրս գալուց առաջ:
Հանձնարարել գործակալներին

Ընտրեք ձեր անձնական մոդելը որպես լռելյայն ընտրված գործակալների համար. կառավարվող Claude/GPT մոդելները մնում են հասանելի կողք կողքի:

GPU-ի վարձույթը գանձվում է առանձին Digio պլանի բաժանորդագրություններից: Կապվեք մեզ հետ կարողությունների պլանավորման, SLA-ների և գոյություն ունեցող եզրակացությունների կլաստերից միգրացիայի համար:

ՀՏՀ

Մոդելներ և GPU հարցեր

Ընտրելով կառավարվող API-ներ՝ ընդդեմ Digio-ում ինքնակառավարվող եզրակացության:

Արդյո՞ք վճարում եմ կրկնակի՝ պլան գումարած API-ն:

Ձեր Digio-ի բաժանորդագրությունն ընդգրկում է ենթակառուցվածքները, գործակալները և ներառված Digio Tokens-ը: Կառավարվող մոդելի օգտագործումը դեբետում է այդ խորհրդանիշի մնացորդը՝ ըստ փաստացի մուտքային/ելքային նշանների: GPU-ի վարձույթը հավելում է ձեր կողմից կառավարվող մեքենաների համար:

Կարո՞ղ են տարբեր գործակալներ օգտագործել տարբեր մոդելներ:

Այո, յուրաքանչյուր գործակալ կարող է ունենալ իր լռելյայն: Առաջադրանքները և զրույցները կարող են անտեսվել մեկ անգամ՝ առանց գլոբալ լռելյայն փոխելու:

Ո՞րն է տարբերությունը Sonnet-ի և Opus-ի միջև:

Opus-ը հարմարեցված է ավելի կոշտ դատողությունների և ավելի երկար համահունչ պլանների համար. Սոնետն ավելի արագ և էժան է ամենօրյա գործակալական օղակների համար: Haiku և flash-class մոդելները լավագույնն են ծավալային ենթաառաջադրանքների համար:

Կարո՞ղ եմ գործարկել միայն իմ սեփական մոդելը և արգելափակել ամպային API-ները:

Ձեռնարկությունների աշխատանքային տարածքները կարող են սահմանափակել ելքային մոդելների մատակարարներին և ուղղորդել գործակալների ամբողջ տրաֆիկը դեպի ձեր GPU-ի վերջնակետը: Հիբրիդային ռեժիմը լռելյայն է թիմերի մեծ մասի համար:

GPU-ի ո՞ր չափերն են հասանելի:

Առաջարկները կախված են տարածաշրջանից և պահանջարկից՝ սովորաբար 24–80 ԳԲ VRAM մակարդակներ 7B–70B դասի մոդելների համար և բազմա-GPU հանգույցներ ավելի մեծ կույտերի համար: Մենք օգնում ենք չափել VRAM-ը ձեր պարամետրերի քանակից և քվանտավորումից:

Արդյո՞ք մասնավոր GPU-ի օգտագործումը դեռ սպառում է Digio Tokens-ը:

Նվագախումբը (գործակալներ, առաջադրանքներ, պահեստավորում) մնում է ձեր պլանում: Ձեր GPU-ի վերաբերյալ եզրակացությունը հաշվարկվում է որպես GPU ժամանակ; Դուք կարող եք կամայականորեն չափել նշանաձև օգտագործումը ներքին լիցքավորման համար:

Բացահայտեք Դիջիոն

Գործի դնել մոդելները

Գործակալներ, առաջադրանքներ և հմտություններ՝ ձեր ընտրած մոդելի շուրջ աշխատանքային տարածքը:

Ընտրեք կառավարվող մոդելներ կամ բերեք ձեր GPU-ն

Սկսեք այսօր Claude-ից և GPT-ից, այնուհետև ավելացրեք հատուկ GPU, երբ պատրաստ լինեք հյուրընկալել հատուկ կշիռները՝ նույն գործակալները, նույն առաջադրանքները, ձեր եզրակացությունը:

Սկսեք Համեմատեք պլանները