DocuBox zvládne téměř jakýkoli formát používaný ve firmách – od PDF, DOCX, XLSX, PPTX, TXT až po nestrukturované texty z Confluence, SharePointu nebo DMS.
Díky vektorovému indexu dokáže efektivně pracovat i s velkými objemy dokumentů a nacházet odpovědi napříč celou firemní dokumentací.
Ano. DocuBox respektuje nastavení oprávnění z Active Directory / Azure AD nebo jiných autentizačních zdrojů. Uživatelé tedy vidí pouze obsah, ke kterému mají právo přístupu — odpovědi z „neviditelných“ dokumentů se vůbec nezobrazí.
DocuBox lze provozovat v prostředí zákazníka (on-premise) nebo v jeho privátní cloudové instanci (např. Azure Tenant).
Všechna data i embeddingy zůstávají v rámci infrastruktury klienta – neodchází mimo firmu.
Systém podporuje šifrování, auditní logy a správu přístupů dle interní politiky bezpečnosti.
Záleží na customizacích a množství integrací na zdroje dat, ale základní pilotní instalaci lze spustit již za 2–3 týdny.
Ano, systém má otevřené REST API a podporu pro běžné firemní služby jako SharePoint, Jira, Confluence, YouTrack, Odoo nebo ServiceNow.
Umí tak obohatit existující workflow o chytré vyhledávání nebo odpovídání nad interními daty.
Copilot čerpá odpovědi z dokumentů v Microsoft 365 nebo otevřených aplikací, ale nezaměřuje se na porozumění obsahu a udržení kontextu.
DocuBox naopak indexuje všechny dostupné firemní zdroje, drží kontext napříč systémy a lze jej nasadit i mimo ekosystém Microsoftu. DocuBox je specializovaný AI nástroj pro efektivní vyhledávání, zatímco Copilot je obecným LLM asistentem, nebude tedy nikdy adekvátní náhradou aplikace DocuBox. Cena DocuBoxu je navíc výrazně nižší než cena Copilotu, což je rozhodující pro organizace, které se zajímají především o vyhledávání a nevyužijí ostatní funkce Copilotu.
Automaticky sleduje změny ve zdrojových systémech a aktualizuje index bez nutnosti ručního zásahu.
DocuBox nevyhledává jen podle shody slov, ale podle významové podobnosti.
Využívá tzv. vektorové vyhledávání (semantic search) – každé slovo, věta i odstavec jsou převedeny do číselné podoby (vektoru), který reprezentuje jejich význam.
Díky tomu dokáže systém najít relevantní odpověď i tehdy, když se dotaz liší slovní formulací – například „úroková sazba“ a „výše úroku“ budou rozpoznány jako stejný pojem.
Ano. DocuBox má vestavěnou podporu pro OCR (optické rozpoznávání znaků), díky které dokáže zpracovat i naskenované dokumenty, PDF nebo fotografie textů.
Text se automaticky extrahuje a zaindexuje stejně jako u běžného dokumentu – včetně možnosti vyhledávání podle významu a kontextu.