Knowledge base RAG
Carica PDF, Markdown, fonti web. Sophia chunka, indicizza ed espone un retriever pronto per qualsiasi LLM.
Sophia è la piattaforma RAG di SoftInstigate. Trasforma la conoscenza della tua azienda — documenti, prodotti, processi, ticket — in un agente AI conversazionale, accessibile via web, API o MCP.
Gli LLM sono straordinari. Ma rispondono con la conoscenza del mondo — non con la tua. Sophia porta la tua knowledge base dentro ogni risposta.
Non inventa. Cita. Ogni risposta viene dai tuoi PDF, contratti, wiki, ticket.
Claude down? Switcha su GPT-4o in automatico. Il tuo servizio non si interrompe.
Smart Routing per fase, prompt caching, history stripping: ogni risposta è più economica della precedente.
La stessa domanda. Due mondi diversi.
costo per risposta nelle conversazioni ricorrenti, grazie a Smart Routing + prompt caching
* Misurato su agenti tipici con Smart Routing e prompt caching attivi. Il risparmio cresce col volume di chat.
Carica PDF, Markdown, fonti web. Sophia chunka, indicizza ed espone un retriever pronto per qualsiasi LLM.
Ogni agente è anche un MCP server: integralo in Claude Code, Cursor o qualsiasi client MCP-compatibile.
Claude, Nova, Mistral, Nemotron, Qwen, MiniMax: scegli l'LLM per agente, cambialo senza riscrivere prompt.
Ogni fase del turno (pianificazione, risposta, salvataggio contesto, follow-up) gira sul modello giusto: caro dove la qualità conta, economico dove basta. Fino a −40% sul costo a parità di output.
Il prefisso ricorrente (system prompt + tool definitions + documenti) viene riusato tra chiamate al 10% del costo. Più la conversazione cresce, più la risposta successiva costa poco.
Auth, ACL, audit, tag filtering, change streams, multi-tenant. Tutto incluso, niente lavoro custom.
Dove Sophia AI sta già lavorando.
Settori: manifatturiero, servizi B2B, software, consulenza, assicurazioni
Il venditore ottiene in tempo reale le informazioni giuste per ogni trattativa: prezzi aggiornati, schede prodotto, storico del cliente, casi d'uso affini già chiusi. Sophia AI integra CRM, catalogo e documentazione in un unico agente conversazionale accessibile dal device preferito.
Settori: retail, ricambi industriali, componenti, edilizia, distribuzione
Sophia AI si integra nel catalogo online e risponde alle domande tecniche del compratore in fase d'acquisto: compatibilità, disponibilità magazzino, normative di installazione. Il cliente riceve la risposta giusta senza lasciare il sito, senza sapere che lo strumento si chiama Sophia AI.
Settori: macchinari, elettrodomestici, software, automotive, telecomunicazioni
Manuali di fornitori diversi, in formati e lingue eterogenei, indicizzati così come sono. L'agente risponde combinando la documentazione con lo storico ticket del cliente dal CRM. Il deflection rate è misurabile dalla prima settimana.
Settori: compagnie assicurative, reti di consulenza finanziaria, banche
La normativa cambia continuamente. Il RAG garantisce che la risposta venga sempre dalla fonte documentale aggiornata. Combinando normativa e dati del cliente nel CRM, ogni agente risponde nel contesto specifico della pratica in corso.
Settori: retail, logistica, franchising, aziende con alto turnover
Sophia AI rende la knowledge base aziendale interrogabile nel momento del bisogno. Documenti operativi e dati di assessment comportamentale in un unico agente per HR: dalla selezione all'onboarding fino alla gestione delle prestazioni.
Settori: grandi PMI, corporate, studi legali, uffici compliance
Corpus normativo in aggiornamento frequente, con documenti che si sovrappongono e si contraddicono. Agenti separati per dominio giuridico (lavoro, privacy, appalti) con accesso controllato per reparto.
Agenti pubblici, niente login richiesto.
Documentazione ufficiale di RESTHeart, plugin API, configurazione.
Design e configurazione di backend RESTHeart Cloud.
Agente fiscale italiano basato su documenti dell'Agenzia delle Entrate.
Esempio di supporto post-vendita: BrewMaster Pro 3000 — manuali, troubleshooting, garanzia, FAQ.
Cloud gestito, una pipeline RAG pronta in giorni.
| Agente | Mensile | Annuale (−10%) |
|---|---|---|
| Primo agente | €149/mese | €1.609/anno |
| Ogni agente aggiuntivo | €99/mese | €1.069/anno |
Include infrastruttura dedicata, aggiornamenti software, supporto lun-ven 9-18 CET, risposta guasto bloccante entro 4h lavorative.
I costi di chiamata ai modelli LLM (token input/output, embeddings) sono fatturati direttamente dal provider al prezzo di listino. Sophia non applica alcun markup. Il modello si sceglie per agente.
Esempi di modelli economici
| Modello | Provider | Costo per 1M token (in / out) |
|---|---|---|
| Claude Haiku 4.5 | Anthropic | ~$1 / $5 |
| Nemotron Nano 9B | NVIDIA | ~$0,10 / $0,30 |
Prezzi indicativi, soggetti alle variazioni del provider. Forniamo dashboard di monitoring per i consumi.
Non sei solo. Un team di consulenti SoftInstigate ti affianca a quattro mani in tutte le attività necessarie per portare il servizio in produzione. Dall'analisi della tua knowledge base alla messa online dell'agente: lo facciamo insieme.
Cosa facciamo insieme
Le cifre sopra sono al netto dei costi di inferenza LLM (vedi sezione precedente). Oltre 3 agenti: contattaci per un'offerta Enterprise.
ContattaciPer organizzazioni che hanno bisogno di controllo completo sui dati, sull'infrastruttura e sul ciclo di vita degli agenti. Sophia Enterprise è il modo per portare la stessa piattaforma RAG in produzione su scala e con i vincoli di un'azienda strutturata.
Sophia installata sull'infrastruttura del cliente, dati che non lasciano mai il perimetro aziendale. Compatibile con modelli LLM locali (Llama, Nemotron, ecc.).
Istanza isolata sul cloud SoftInstigate, separazione fisica delle risorse, networking dedicato, modello LLM a scelta del cliente.
SoftInstigate gestisce aggiornamenti, monitoring, backup, scaling. Il cliente lavora sugli agenti, noi sulla piattaforma.
Raccontaci il tuo caso d'uso: ti rispondiamo entro un giorno lavorativo.