Տեքստային բովանդակության ստուգում
Երբ Դուք ներմուծում եք տեքստային պնդում (այդ թվում՝ ձայնային տարբերակով, որը վերածվում է տեքստի), STUGEL-ն այն անցկացնում է 9-փուլանոց ստուգման շղթայով: Յուրաքանչյուր քայլ ավելացնում է վերլուծության նոր շերտ՝ ձեր մուտքագրած տեքստից մինչև մաթեմատիկական վստահության միավորով եզրակացություն:
Մուտքագրված տվյալների ընկալում
Երբ Դուք ուղարկում եք տեքստը, համակարգը նախ որոշում է դրա բնույթը: Կան մի քանի հնարավոր տարբերակներ.
• Եթե հաղորդագրությունը պարունակում է կոնկրետ փաստացի պնդում (իրադարձություն, մեջբերում, վիճակագրություն, քաղաքական հայտարարություն), այն անմիջապես անցնում է փաստերի ստուգման փուլ:
• Եթե հաղորդագրությունը չափազանց անորոշ է կամ բաղկացած է միմյանց հետո տրամաբանորեն չկածպված բառերից, համակարգը խնդրում է ձեզ տրամադրել ավելի մանրամասն տեղեկություն:
• Եթե հաղորդագրությունը ողջույն է կամ ընդհանուր բնույթի զրույց, համակարգը պատասխանում է անմիջապես՝ ջերմորեն զրուցելով Ձեզ հետ:
• Սուբյեկտիվ կարծիքները, անձնական բնույթի հարցերը, մասնավոր խնդիրները և աբստրակտ հարցումները դասակարգվում են որպես փաստերի ստուգման համար ոչ ենթակա հաղորդագրություններ, և համակարգը բացատրում է պատճառը, թե ինչու չի կարող ստուգել դրանք:
Կասկածի դեպքում համակարգը միշտ նախապատվությունը տալիս է փաստերի ստուգմանը: Այն նախագծված է ստուգելու, այլ ոչ թե մերժելու համար:
Պնդումների տարանջատում
Շատ պնդումներ պարունակում են մեկ նախադասության մեջ խտացված մի քանի փաստացի հայտարարություններ կամ պնդումներ: Նախքան ստուգումը սկսելը, համակարգը բարդ նախադասությունները բաժանում է անկախ, առանձին ենթապնդումների, որոնցից յուրաքանչյուրը կարող է ստուգվել առանձին:
Օրինակ՝ «Պաշտոնյան հայտարարել է, որ բալային համակարգի ներդրման արդյունքում ճանապարհային պատահարների թիվը կրկնակի նվազել է» նախադասությունը վերածվում է երկու առանձին ստուգման ենթական պնդման.
1) Արդյո՞ք պաշտոնյան իրականում արել է նման հայտարարություն (հայտարարության աղբյուրի ստուգում):
2) Արդյո՞ք իրականում բալային համակարգի ներդրման արդյունքում ճանապարհային պատահարների թիվը կրկնակի նվազել է (փաստի ստուգում):
Յուրաքանչյուր ենթապնդում գնահատվում է ըստ հանրային հետաքրքրության կարևորության (քաղաքականություն, անվտանգություն, առողջապահություն, տնտեսություն և այլն), և ամենաազդեցիկները ստուգվում են առաջնահերթ: Մինչև 3 ենթապնդում ստուգվում են զուգահեռաբար, իսկ դրանց արդյունքները համադրվում են:
Որոնում անկախ շտեմարաններում
Յուրաքանչյուր ենթապնդում միաժամանակ որոնվում է չորս անկախ տվյալների շերտերում՝ օգտագործելով սեմանտիկ (իմաստային) որոնում, այլ ոչ թե պարզ բառային համընկնում: Համակարգը ձեր պնդումը վերածում է դրա իմաստի մաթեմատիկական պատկերման և գտնում է մոտակա համընկնումները.
Ա) Լրատվական հոդվածների շտեմարան՝ մշտապես թարմացվող շտեմարան հայկական և միջազգային լրատվամիջոցներից: Սա ապացույցների հիմնական աղբյուրն է:
Բ) Հայտնի ապատեղեկատվության օրինաչափություններ — Նախկինում բացահայտված կեղծ լուրերի և ապատեղեկատվական արշավների համակարգված շտեմարան:
Գ) Նախկին փաստերի ստուգման արդյունքներ — Վստահելի փաստերի ստուգման կազմակերպությունների եզրակացություններ:
Դ) Թեմատիկ կլաստերների ամփոփագրեր — Նույն թեմայով հոդվածների խմբերը ավտոմատ կերպով խմբվորվում և ամփոփվում են՝ ապահովելով ավելի լայն համատեքստ:
Ե) Եթե հարցմանը վերաբերելի համընկնումներ վերոնշյալ շտեմարաններում չեն հայտնաբերվում, ապա մոդելը իրականացնում է արագ որոնում համացանցում։
Աղբյուրի վստահելիության գնահատում
Ոչ բոլոր աղբյուրներն ունեն հավասար վստահելիության մակարդակ: Համակարգը գնահատում է յուրաքանչյուր աղբյուր մի քանի չափորոշիչներով.
• Վստահելիության մակարդակ — Մոդելն ինքնաշխատ եղանակով վերլուծում է նախկինում հայտնաբերված ապատեղեկատվության աղբյուր հանդիսացած կամ դրա տարածմանը նպաստած ռեսուրսները, յուրաքանչյուր դեպքում հատկացնում է տուգանքի միավորներ և դասակարգվում է «Շատ բարձր»-ից մինչև «Շատ ցածր»:
• Հրապարակման ամսաթիվ — Թարմ հոդվածներն ավելի մեծ կշիռ ունեն, քան հները: Մեկ տարուց ավելի հնություն ունեցող հոդվածները դեռ հաշվի են առնվում, բայց ունեն նվազագույն ազդեցություն:
• Աղբյուրների բազմազանություն — Համակարգը ստուգում է, թե քանի անկախ մեդիա խումբ է ներկայացված: Միևնույն մեդիա խմբի հինգ հոդվածը հաշվվում է որպես մեկ ձայն, այլ ոչ թե հինգ անկախ հաստատում:
• Բնօրինակ vs Վերատպում — Տեղեկատվության առաջնային աղբյուրը (բնօրինակը հրապարակողը) ստանում է լրացուցիչ առավելություն վերատպողների նկատմամբ: Միևնույն տրամաբանությամբ ապատեղեկատվության դեպքում բնօրինակը ստանում է ավելի շատ տուգանային միավոր, քան տարածողը։
Կողմնակալության և մանիպուլյացիայի հայտնաբերում
Փաստացի ստուգումից զատ, համակարգը վերլուծում է նաև պնդման շարադրանքը: Այն փնտրում է հռետորական հնարքներ, որոնք կարող են վկայել մանիպուլյացիայի մասին.
• Հուզական լեզու — Բառեր, որոնք նախատեսված են վախ, զայրույթ կամ համակրանք հարուցելու համար:
• Միակողմանի ներկայացում — Միայն մեկ տեսանկյունի մատուցում՝ բաց թողնելով հակադիր փաստարկները:
• Սենսացիոնալիզմ — Չափազանցություն կամ դրամատիզացում, որը դուրս է փաստերի սահմանից:
• Ուղղորդված տերմիններ — Կանխակալ լեզու, որն իր մեջ կրում է թաքնված դատողություն:
Կողմնակալության մակարդակը հաշվի է առնվում վերջնական եզրակացության մեջ որպես մոլորեցնող համատեքստի ապացույց, նույնիսկ եթե հիմնական փաստերը մասամբ ճիշտ են:
Հակափաստարկների որոնում
Հավասարակշռված վերլուծություն ապահովելու համար համակարգը ակտիվորեն փնտրում է հակադիր տեսակետներ: Եթե ապացույցները պաշտպանում են պնդումը, այն փնտրում է աղբյուրներ, որոնք հերքում են այն, և հակառակը:
Այս քայլը վճռորոշ է հավասարակշռված գնահատականի համար: Գտնված հակափաստարկների քանակը ազդում է վստահության միավորի վրա. որքան շատ են հիմնավոր հակադիր տեսակետները, այնքան ցածր է վստահության միավորը՝ արտացոլելով իրական անորոշությունը:
Եթե որևէ հիմնավոր հակափաստարկ գոյություն չունի (օրինակ՝ համընդհանուր ընդունված փաստերի դեպքում), վստահության միավորը չի նվազում:
Վերջնական եզրակացության ձևավորում
Բոլոր հավաքագրված ապացույցները փոխանցվում են հզոր լեզվական մոդելին (Gemini), որը գնահատում է ամեն ինչ և տալիս է եզրակացություն՝ հետևելով խիստ կանոնների.
• Եթե ոչ մի աղբյուր ուղղակիորեն չի վկայում իրադարձության մասին կամ շտեմարաններում հայտնաբերված նյութերը ունենում են խիստ սակավ նմանություն պնդմանը, ապա եզրակացությունը լինում է՝ «Ստուգել հնարավոր չէ»:
• Եթե հարցման մեջ առկա են մեկից ավել պնդումներ, ապա մոդելը առկա առավելագույնը 3 ամենակարևոր պնդումները ստուգում է առանձին-առանձին։ Դրանից հետո համադրում է երեք պնդումների եզրակացությունները և գեներացնում է վերջնական, միասնական եզրակացությունը, որն արդեն վերաբերում է ամբողջական հարցման տեքստին։
• Եթե հարցման մեջ առկա փաստահեն պնդումների համեմատ գերակշռում են սուբյեկտիվ, կողմնակալ ձևակերպումները, ապա մոդելը եզրակացության մեջ ընդգծում է տվյալ հանգամանքը՝ առավելապես հակվելով հարցման տեքստի մանիպուլատիվ բնույթի արձանագրմանը։
• Մոդելը հայտնաբերված ապացույցների հետ մեկտեղ համադրում է նաև այդ ապացույցները վկայակոչող աղբյուրների հեղինակությունը, որը հաշվարկվում է ինքնաշխատ կերպով։
• Կախված ապացույցների ժամանակային թարմությունից, դեմ և կողմ փաստերի համադրությունից, ռեսուրսների հեղինակությունից՝ խոշոր լեզվական մոդելը կատարում է տրամաբանական դատողություն և գեներացնում է եզրակացությունը ուղարկված տեքստային կոնտենտի հավաստիության վերաբերյալ։
• Եզրակացությանը կցվում է «Հաստատված», «Մեծամասամբ ճիշտ», «Մոլորեցնող», «Հերքված» կամ «Ստուգել հնարավոր չէ» պիտակներից մեկը։
Մաթեմատիկական վստահության միավոր
Եզրակացությունից զատ, հաշվարկվում է դրա վստահության միավորը (0–100%): Այս միավորի վրա լեզվական մոդելը չի կարող ազդել. այն մաքուր մաթեմատիկական հաշվարկ է՝ հիմնված գտնված ապացույցների վրա:
Բանաձևը համադրում է հինգ գործոն՝ ապացույցների ուժը (կշռված ըստ աղբյուրների), աղբյուրների համաձայնեցվածությունը, անկախ մեդիա խմբերի քանակը, թեմայի լուսաբանման լայնությունը և հակափաստարկների առկայությունը:
Այս միավորը ցույց է տալիս, թե որքան ապացույց կա եզրակացության հետևում: «Հաստատված» եզրակացությունը 90% վստահությամբ նշանակում է շատ ամուր հիմքեր, իսկ 55% վստահությամբ՝ ավելի թույլ ապացուցողական բազա:
Եզրակացության մակարդակներ
Յուրաքանչյուր փաստի ստուգում ավարտվում է հինգ եզրակացության մակարդակներից մեկով: Եզրակացությունը որոշվում է AI մոդելի կողմից՝ հիմնվելով գտնված ապացույցների վրա:
Հաստատված
Պնդումը լիովին հաստատված է բազմաթիվ վստահելի աղբյուրների կողմից: Տեղեկությունը հաստատվել է պաշտոնական փաստաթղթերով կամ անկախ լրատվամիջոցների հուսալի հրապարակումներով:
Մեծամասամբ ճիշտ
Պնդման հիմքը ճիշտ է, սակայն այն պարունակում է աննշան անճշտություններ կամ բացակայում է որոշակի համատեքստ: Էական մասը վավեր է, բայց որոշ մանրամասներ լիովին չեն համապատասխանում առկա ապացույցներին:
Մոլորեցնող
Պնդումը պարունակում է իրական փաստեր, բայց դրանք աղավաղված են, ներկայացված են ընտրողաբար կամ այնպիսի ձևակերպմամբ, որը ստեղծում է սխալ տպավորություն: Սա ներառում է նաև որպես փաստ մատուցվող քաղաքական կարծիքները:
Հերքված
Պնդումը ուղղակիորեն հակասում է վստահելի ապացույցներին: Առկա փաստերը ցույց են տալիս, որ պնդումը կեղծ է կամ խիստ աղավաղված:
Ստուգել հնարավոր չէ
Բավարար ապացույցներ չկան պնդումը հաստատելու կամ հերքելու համար: Շտեմարանում առկա չէ համապատասխան տեղեկատվություն, կամ պնդումը բավարար չափով չի համընկնում որևէ աղբյուրի հետ:
Վստահության միավոր
Վստահության միավորը (0–100%) հաշվարկվում է մաթեմատիկական բանաձևով, որը լիովին անկախ է AI մոդելից: Այն ներկայացնում է զուտ թվային չափանիշ, թե որքան ամուր են հայտնաբերված ապացույցները:
Միավոր = WE × Consistency × Diversity × ClusterCoverage × (1 − CP)WEԿշռված ապացույցներ
Որքան ամուր են ապացույցները՝ հաշվի առնելով յուրաքանչյուր աղբյուրի վստահելիությունը
ConsistencyՀամաձայնեցվածություն
Արդյո՞ք աղբյուրները համակարծիք են: Եթե բոլոր աղբյուրները նույնն են պնդում, միավորը բարձրանում է:
DiversityԲազմազանություն
Քանի անկախ մեդիա խումբ է հաստատում տեղեկությունը: Լիարժեք հաստատման համար անհրաժեշտ է առնվազն 3 անկախ խումբ:
ClusterCoverageԹեմայի ընդգրկում
Որքան լայնորեն է լուսաբանվել թեման: Շատ աղբյուրների կողմից լուսաբանված դեպքերը ստանում են լրացուցիչ միավոր:
1 − CPՀակափաստարկի տուգանք
Նվազեցնում է միավորը, երբ առկա են հիմնավոր հակափաստարկներ: Առավելագույն տուգանքը կարող է կազմել մինչև 25%:
Ինչպես հասկանալ վստահության միավորը
• 80–100% — Շատ ամուր ապացույցներ բազմաթիվ անկախ և վստահելի աղբյուրներից:
• 60–79% — Լավ ապացույցներ, բայց կարող են հիմնված լինել քիչ կամ խառը վստահելիության աղբյուրների վրա:
• 40–59% — Սահմանափակ ապացույցներ: Որոշ աղբյուրներ հաստատում են, բայց բազմազանությունը պակասում է:
• 40%-ից ցածր — Թույլ ապացույցներ: Գտնվել են շատ քիչ առնչվող աղբյուրներ:
• 10% — Նվազագույն միավոր: Շտեմարանում տվյալ պնդման վերաբերյալ որևէ առնչվող տեղեկություն չի գտնվել:
Պատկերի ստուգում
Պատկերի ստուգումն իրականացվում է Geniale մոդելի միջոցով (SigLIP + DINOv2 fusion), որն էլ ձևավորում է վերջնական եզրակացությունը։ Այն համալրված է ELA և սպեկտրալ վերլուծություններով։
Geniale դետեկտոր (SigLIP + DINOv2)
Պատկերի մշակումն իրականացվում է Geniale մոդելի միջոցով (SigLIP + DINOv2 fusion), որն էլ ձևավորում է վերջնական եզրակացությունը: Շեմը՝ 0.60 — միավորը ≥ 0.60 → սինթետիկ (AI), միավորը < 0.60 → իրական:
ELA վերլուծություն
Error Level Analysis-ը հայտնաբերում է սեղմման (compression) անհամապատասխանությունները պատկերներում՝ բացահայտելով թվային փոփոխության ենթարկված կամ մոնտաժված հատվածները:
Սպեկտրալ վերլուծություն
Սպեկտրալ վերլուծությունը հայտնաբերում է AI-ով գեներացված պատկերների կողմից թողնված բնորոշ հետքերը:
Տեսանյութի ստուգում
Տեսանյութի հայտնաբերումն անցնում է բազմաստիճան վերլուծության միջով՝ կադրերի ընտրանք, կադր առ կադր գնահատում, զուգահեռ մոդելների համաձայնության ստուգում, դեմքի առկայության դեպքում՝ լրացուցիչ ֆորենզիկ վերլուծություն, և վերջնական ագրեգացում։ Օգտագործվում են SigLIP + DINOv2 մոդելները, անկախ տարածական ու ժամանակային դետեկտորները և head-v1 ագրեգատորը։ Արդյունքը ներկայացվում է ժամանակային գծապատկերով, որտեղ երևում է յուրաքանչյուր հատվածի միավորը։
Կադրերի ընտրանք (windowed sampling)
Տեսանյութից կադրերն ընտրվում են ժամանակային պատուհանների ռազմավարությամբ (windowed 6×18)՝ ապահովելով ամբողջ տեսանյութի հավասարաչափ ծածկույթը սկզբից մինչև վերջ, ոչ միայն առաջին կադրերի հիման վրա։
Կադր առ կադր գնահատում
Յուրաքանչյուր ընտրված կադրի համար հաշվարկվում է կեղծ լինելու հավանականությունը SigLIP + DINOv2 մոդելների հիման վրա։ Արդյունքը ներկայացվում է ինտերակտիվ ժամանակային գծապատկերով, որտեղ յուրաքանչյուր հատված ունի իր գույնային միավորը։
Բազմա-մոդելային ագրեգացում
Զուգահեռ աշխատում են մի քանի անկախ դետեկտորներ՝ head-v1, v2, տարածական (spatial) և ժամանակային (temporal)։ Վերջնական որոշումը կայացվում է դրանց համաձայնության կամ տարակարծիքության հիման վրա՝ մեծացնելով վստահելիությունը, երբ բոլոր մոդելները միասնական են։
Դեմքի ֆորենզիկ ստուգում
Երբ տեսանյութում հայտնաբերվում է դեմք, միացվում են լրացուցիչ դեմք-կենտրոն վերլուծություններ՝ հատկանշային համապատասխանության, արտեֆակտների և ժամանակային հետևողականության ստուգումներ։ Սա կրիտիկական շերտ է deepfake-ների հայտնաբերման համար։
Վերջնական ագրեգացում (head-v1)
Կադրային միավորները համադրվում են վիճակագրական ցուցանիշներով՝ mean, max, std, p90/p95, fake_ratio, run-length: Head-v1 ագրեգատորը համատեղում է այս ցուցանիշները դետեկտորների որոշումների հետ՝ ստանալով վերջնական շեմային եզրակացություն։
Ստուգման սահմանաչափեր
Սերվերային ծանրաբեռնվածության հավասարակշռված բաշխման համար սահմանված են օրական ստուգումների սահմանաչափեր։ Գրանցվելով օգտվողները ստանում են զգալիորեն ավելի հնարավորություններ։
Չգրանցված օգտվող
- Տեքստային ստուգում՝ օրական 3 հարցում
- Պատկերի ստուգում՝ օրական 3 պատկեր
- Տեսանյութի ստուգում՝ օրական 1 տեսանյութ
Գրանցված օգտվող
- Տեքստային ստուգում՝ օրական 10 հարցում
- Պատկերի ստուգում՝ օրական 10 պատկեր
- Տեսանյութի ստուգում՝ օրական 3 տեսանյութ
* Սահմանաչափերը զրոյացվում են յուրաքանչյուր հաջորդ օրվա համար։ Գրանցվելու համար անհրաժեշտ է մուտք գործել հարթակ։
Հրաժարագիր
- •Շտեմարանի ընդգրկում․ Մեր շտեմարանը կարող է չպարունակել տեղեկատվություն բոլոր թեմաների վերաբերյալ: Մենք անընդհատ թարմացնում ենք աղբյուրները, սակայն ընդգրկումը կախված է մեր կողմից մոնիտորինգի ենթարկվող լրատվամիջոցների, լրատվական ռեսուրսների, սոցցանցային էջերի հրապարակումներից, ինչը չի կարող լիարժեք լինել:
- •ԱԲ-ն մարդ-փորձագետ չէ․ STUGEL-ը չի փոխարինում պրոֆեսիոնալ փաստեր ստուգողներին: Արդյունքները խորհրդատվական են: Միշտ համեմատեք արդյունքներն այլ աղբյուրների հետ:
- •Համատեքստի զգայունություն․ Սարկազմը, հեգնանքը և մշակութային նրբությունները կարող են ազդել վերլուծության ճշգրտության վրա: Համակարգը լավագույնս աշխատում է հստակ փաստացի պնդումների հետ:
- •Լայնորեն տարածված կեղծ պնդումներ․ Եթե կեղծ պնդումը լայնորեն տարածված է բազմաթիվ լրատվամիջոցներում և հատկապես՝ տեղ է գտել փաստեր ստուգող հեղինակավոր աղբյուրներում, կա հավանականություն, որ մոդելի կողմից պնդումը կհամարվի ճշմարիտ, քանի որ մոդելն արտացոլում է տեղեկատվության ծավալը և որակը, այլ ոչ թե եղելությունը:
- •Մեդիա ստուգման որակ․ Պատկերի և տեսանյութի ստուգման ճշգրտությունը կախված է ֆայլի որակից: Նորագույն սերնդի բարձրորակ մոդելներով գեներացված դիփֆեյքերը կարող են խուսափել հայտնաբերումից: Մենք պարբերաբար աշխատում ենք թարմացնել դիփֆեյքեր հայտնաբերող սենսորները։
STUGEL հարթակը չի փոխարինում փաստերի ստուգման մասնագետների աշխատանքին։ STUGEL-ն օգտագործում է բնական լեզվի մշակման և սինթետիկ մեդիայի հայտնաբերման գործիքներ Ձեր տրամադրած կոնտենտի հավաստիությունը ստուգելու համար։ Մոդելը կարող է սխալվել։ Հնարավոր է՝ տվյալները թերի լինեն կամ մոդելը տրամաբանական/հաշվարկային սխալներ թույլ տա։ STUGEL հարթակի եզրակացությունները կարելի է օգտագործել որպես ուղղորդող, և ոչ որպես բացարձակ եզրահանգում։
Ահա մի քանի սահմանափակում, որոնք պետք է հաշվի առնել՝