Invoice (SF) Generatorius: Nuo Natūralios Kalbos iki Struktūrinio JSON
Užmirškite sudėtingas formas ir daugybę laukų. Tiesiog aprašykite sąskaitą faktūrą natūralia lietuvių kalba, o dirbtinis intelektas automatiškai ekstrahuos visą reikalingą informaciją ir sugeneruos standartinį JSON, kurį galima lengvai konvertuoti į PDF.
Išbandykite Dabar
Greitas pavyzdys:
Sugeneruotas JSON:
Kaip konvertuoti į PDF?
Šį JSON galite naudoti su bet kuria PDF generavimo biblioteka (pvz., jsPDF, pdfmake, wkhtmltopdf). Struktūra jau standartizuota ir paruošta tiesioginiam naudojimui.
Kodėl Natūrali Kalba yra Revoliucija?
1. Žmogiška sąsaja, mašininis tikslumas
Užuot pildę 20+ laukų formoje, tiesiog parašykite kaip kalbėtumėte kolegai: "gavėjas UAB Klientas, tiekėjas Jonas, už programavimo darbus 100 EUR be PVM 5 val." Sistema supranta kontekstą ir ištraukia: pirkėjo duomenis, pardavėjo duomenis, paslaugas, sumas, PVM statusą.
2. Lankstumas ir greitis
Nereikia ieškoti kur įvesti banko sąskaitą, kur telefono numerį. Įrašykite viską vienoje vietoje bet kokia tvarka. ML modelis (multilingual-e5-large + ChromaDB) atpažįsta kategorijas semantiškai: jis "supranta", kad "tel. +37060012345" yra telefono numeris, o "LT123..." yra IBAN.
3. Standartizuotas išvestis - lengva integracija
Nepaisant to, kaip chaotiškai įvedėte duomenis, gausite struktūruotą JSON su aiškia hierarchija:
-
seller- pardavėjo duomenys (pavadinimas, kodas, PVM, bankas) -
buyer- pirkėjo duomenys -
items[]- paslaugos/prekės su kiekiais ir kainomis -
totals- automatiškai apskaičiuotos sumos (subtotal, PVM, total)
4. Trivialus konvertavimas į PDF
JSON struktūra yra idealiai pritaikyta PDF generatoriams. Galite naudoti:
- jsPDF (JavaScript) - frontend PDF generavimas
- pdfmake (JavaScript) - deklaratyvus PDF su šablonais
- ReportLab (Python) - serverio pusės PDF generavimas
- wkhtmltopdf - HTML→PDF konvertavimas
Viskas ką reikia - paimti JSON ir pritaikyti savo šabloną. Be jokio papildomo apdorojimo.
Kaip Veikia Technologija?
ML Semantinis Atpažinimas
Naudojamas multilingual-e5-large transformer modelis, kuris "supranta" lietuvių kalbą semantiškai. Jis kuria embeddings (vektorius) kiekvienam teksto fragmentui ir palygina su žinomomis kategorijomis (BUYER, SELLER, AMOUNT, VAT_STATUS, etc.) per ChromaDB vektorinę duomenų bazę.
REGEX Pattern Matching
Papildomai sistemoje įdiegti regex šablonai
struktūriniams duomenims:
įmonės kodas (9 skaitmenys),
PVM kodas (LT + skaitmenys),
IBAN,
el. paštas,
telefonas.
API FastAPI Backend
Visas apdorojimas vyksta FastAPI serveryje. Modelis užkraunamas vieną kartą paleidimo metu ir laikomas atmintyje, užtikrinant greitą atsakymą (tipiškai <2s).
API Integracija
Norėdami integruoti šią funkciją į savo sistemą, galite tiesiogiai naudoti API:
POST /extract
{
"text": "gavėjas UAB Klientas tiekėjas Jonas už programavimo 100 EUR"
}
Atsakymas - pilnas JSON su visais ištratuktais duomenimis, paruoštas PDF generavimui.