STUGEL.am — Կոնտենտի ստուգման AI հարթակ

Տեքստային բովանդակության ստուգում

Երբ Դուք ներմուծում եք տեքստային պնդում (այդ թվում՝ ձայնային տարբերակով, որը վերածվում է տեքստի), STUGEL-ն այն անցկացնում է 9-փուլանոց ստուգման շղթայով: Յուրաքանչյուր քայլ ավելացնում է վերլուծության նոր շերտ՝ ձեր մուտքագրած տեքստից մինչև մաթեմատիկական վստահության միավորով եզրակացություն:

Մուտքագրված տվյալների ընկալում

Երբ Դուք ուղարկում եք տեքստը, համակարգը նախ որոշում է դրա բնույթը: Կան մի քանի հնարավոր տարբերակներ.

• Եթե հաղորդագրությունը պարունակում է կոնկրետ փաստացի պնդում (իրադարձություն, մեջբերում, վիճակագրություն, քաղաքական հայտարարություն), այն անմիջապես անցնում է փաստերի ստուգման փուլ:

• Եթե հաղորդագրությունը չափազանց անորոշ է կամ բաղկացած է միմյանց հետո տրամաբանորեն չկածպված բառերից, համակարգը խնդրում է ձեզ տրամադրել ավելի մանրամասն տեղեկություն:

• Եթե հաղորդագրությունը ողջույն է կամ ընդհանուր բնույթի զրույց, համակարգը պատասխանում է անմիջապես՝ ջերմորեն զրուցելով Ձեզ հետ:

• Սուբյեկտիվ կարծիքները, անձնական բնույթի հարցերը, մասնավոր խնդիրները և աբստրակտ հարցումները դասակարգվում են որպես փաստերի ստուգման համար ոչ ենթակա հաղորդագրություններ, և համակարգը բացատրում է պատճառը, թե ինչու չի կարող ստուգել դրանք:

Կասկածի դեպքում համակարգը միշտ նախապատվությունը տալիս է փաստերի ստուգմանը: Այն նախագծված է ստուգելու, այլ ոչ թե մերժելու համար:

Պնդումների տարանջատում

Շատ պնդումներ պարունակում են մեկ նախադասության մեջ խտացված մի քանի փաստացի հայտարարություններ կամ պնդումներ: Նախքան ստուգումը սկսելը, համակարգը բարդ նախադասությունները բաժանում է անկախ, առանձին ենթապնդումների, որոնցից յուրաքանչյուրը կարող է ստուգվել առանձին:

Օրինակ՝ «Պաշտոնյան հայտարարել է, որ բալային համակարգի ներդրման արդյունքում ճանապարհային պատահարների թիվը կրկնակի նվազել է» նախադասությունը վերածվում է երկու առանձին ստուգման ենթական պնդման.

1) Արդյո՞ք պաշտոնյան իրականում արել է նման հայտարարություն (հայտարարության աղբյուրի ստուգում):

2) Արդյո՞ք իրականում բալային համակարգի ներդրման արդյունքում ճանապարհային պատահարների թիվը կրկնակի նվազել է (փաստի ստուգում):

Յուրաքանչյուր ենթապնդում գնահատվում է ըստ հանրային հետաքրքրության կարևորության (քաղաքականություն, անվտանգություն, առողջապահություն, տնտեսություն և այլն), և ամենաազդեցիկները ստուգվում են առաջնահերթ: Մինչև 3 ենթապնդում ստուգվում են զուգահեռաբար, իսկ դրանց արդյունքները համադրվում են:

Որոնում անկախ շտեմարաններում

Յուրաքանչյուր ենթապնդում միաժամանակ որոնվում է չորս անկախ տվյալների շերտերում՝ օգտագործելով սեմանտիկ (իմաստային) որոնում, այլ ոչ թե պարզ բառային համընկնում: Համակարգը ձեր պնդումը վերածում է դրա իմաստի մաթեմատիկական պատկերման և գտնում է մոտակա համընկնումները.

Ա) Լրատվական հոդվածների շտեմարան՝ մշտապես թարմացվող շտեմարան հայկական և միջազգային լրատվամիջոցներից: Սա ապացույցների հիմնական աղբյուրն է:

Բ) Հայտնի ապատեղեկատվության օրինաչափություններ — Նախկինում բացահայտված կեղծ լուրերի և ապատեղեկատվական արշավների համակարգված շտեմարան:

Գ) Նախկին փաստերի ստուգման արդյունքներ — Վստահելի փաստերի ստուգման կազմակերպությունների եզրակացություններ:

Դ) Թեմատիկ կլաստերների ամփոփագրեր — Նույն թեմայով հոդվածների խմբերը ավտոմատ կերպով խմբվորվում և ամփոփվում են՝ ապահովելով ավելի լայն համատեքստ:

Ե) Եթե հարցմանը վերաբերելի համընկնումներ վերոնշյալ շտեմարաններում չեն հայտնաբերվում, ապա մոդելը իրականացնում է արագ որոնում համացանցում։

Աղբյուրի վստահելիության գնահատում

Ոչ բոլոր աղբյուրներն ունեն հավասար վստահելիության մակարդակ: Համակարգը գնահատում է յուրաքանչյուր աղբյուր մի քանի չափորոշիչներով.

• Վստահելիության մակարդակ — Մոդելն ինքնաշխատ եղանակով վերլուծում է նախկինում հայտնաբերված ապատեղեկատվության աղբյուր հանդիսացած կամ դրա տարածմանը նպաստած ռեսուրսները, յուրաքանչյուր դեպքում հատկացնում է տուգանքի միավորներ և դասակարգվում է «Շատ բարձր»-ից մինչև «Շատ ցածր»:

• Հրապարակման ամսաթիվ — Թարմ հոդվածներն ավելի մեծ կշիռ ունեն, քան հները: Մեկ տարուց ավելի հնություն ունեցող հոդվածները դեռ հաշվի են առնվում, բայց ունեն նվազագույն ազդեցություն:

• Աղբյուրների բազմազանություն — Համակարգը ստուգում է, թե քանի անկախ մեդիա խումբ է ներկայացված: Միևնույն մեդիա խմբի հինգ հոդվածը հաշվվում է որպես մեկ ձայն, այլ ոչ թե հինգ անկախ հաստատում:

• Բնօրինակ vs Վերատպում — Տեղեկատվության առաջնային աղբյուրը (բնօրինակը հրապարակողը) ստանում է լրացուցիչ առավելություն վերատպողների նկատմամբ: Միևնույն տրամաբանությամբ ապատեղեկատվության դեպքում բնօրինակը ստանում է ավելի շատ տուգանային միավոր, քան տարածողը։

Կողմնակալության և մանիպուլյացիայի հայտնաբերում

Փաստացի ստուգումից զատ, համակարգը վերլուծում է նաև պնդման շարադրանքը: Այն փնտրում է հռետորական հնարքներ, որոնք կարող են վկայել մանիպուլյացիայի մասին.

• Հուզական լեզու — Բառեր, որոնք նախատեսված են վախ, զայրույթ կամ համակրանք հարուցելու համար:

• Միակողմանի ներկայացում — Միայն մեկ տեսանկյունի մատուցում՝ բաց թողնելով հակադիր փաստարկները:

• Սենսացիոնալիզմ — Չափազանցություն կամ դրամատիզացում, որը դուրս է փաստերի սահմանից:

• Ուղղորդված տերմիններ — Կանխակալ լեզու, որն իր մեջ կրում է թաքնված դատողություն:

Կողմնակալության մակարդակը հաշվի է առնվում վերջնական եզրակացության մեջ որպես մոլորեցնող համատեքստի ապացույց, նույնիսկ եթե հիմնական փաստերը մասամբ ճիշտ են:

Հակափաստարկների որոնում

Հավասարակշռված վերլուծություն ապահովելու համար համակարգը ակտիվորեն փնտրում է հակադիր տեսակետներ: Եթե ապացույցները պաշտպանում են պնդումը, այն փնտրում է աղբյուրներ, որոնք հերքում են այն, և հակառակը:

Այս քայլը վճռորոշ է հավասարակշռված գնահատականի համար: Գտնված հակափաստարկների քանակը ազդում է վստահության միավորի վրա. որքան շատ են հիմնավոր հակադիր տեսակետները, այնքան ցածր է վստահության միավորը՝ արտացոլելով իրական անորոշությունը:

Եթե որևէ հիմնավոր հակափաստարկ գոյություն չունի (օրինակ՝ համընդհանուր ընդունված փաստերի դեպքում), վստահության միավորը չի նվազում:

Վերջնական եզրակացության ձևավորում

Բոլոր հավաքագրված ապացույցները փոխանցվում են հզոր լեզվական մոդելին (Gemini), որը գնահատում է ամեն ինչ և տալիս է եզրակացություն՝ հետևելով խիստ կանոնների.

• Եթե ոչ մի աղբյուր ուղղակիորեն չի վկայում իրադարձության մասին կամ շտեմարաններում հայտնաբերված նյութերը ունենում են խիստ սակավ նմանություն պնդմանը, ապա եզրակացությունը լինում է՝ «Ստուգել հնարավոր չէ»:

• Եթե հարցման մեջ առկա են մեկից ավել պնդումներ, ապա մոդելը առկա առավելագույնը 3 ամենակարևոր պնդումները ստուգում է առանձին-առանձին։ Դրանից հետո համադրում է երեք պնդումների եզրակացությունները և գեներացնում է վերջնական, միասնական եզրակացությունը, որն արդեն վերաբերում է ամբողջական հարցման տեքստին։

• Եթե հարցման մեջ առկա փաստահեն պնդումների համեմատ գերակշռում են սուբյեկտիվ, կողմնակալ ձևակերպումները, ապա մոդելը եզրակացության մեջ ընդգծում է տվյալ հանգամանքը՝ առավելապես հակվելով հարցման տեքստի մանիպուլատիվ բնույթի արձանագրմանը։

• Մոդելը հայտնաբերված ապացույցների հետ մեկտեղ համադրում է նաև այդ ապացույցները վկայակոչող աղբյուրների հեղինակությունը, որը հաշվարկվում է ինքնաշխատ կերպով։

• Կախված ապացույցների ժամանակային թարմությունից, դեմ և կողմ փաստերի համադրությունից, ռեսուրսների հեղինակությունից՝ խոշոր լեզվական մոդելը կատարում է տրամաբանական դատողություն և գեներացնում է եզրակացությունը ուղարկված տեքստային կոնտենտի հավաստիության վերաբերյալ։

• Եզրակացությանը կցվում է «Հաստատված», «Մեծամասամբ ճիշտ», «Մոլորեցնող», «Հերքված» կամ «Ստուգել հնարավոր չէ» պիտակներից մեկը։

Մաթեմատիկական վստահության միավոր

Եզրակացությունից զատ, հաշվարկվում է դրա վստահության միավորը (0–100%): Այս միավորի վրա լեզվական մոդելը չի կարող ազդել. այն մաքուր մաթեմատիկական հաշվարկ է՝ հիմնված գտնված ապացույցների վրա:

Բանաձևը համադրում է հինգ գործոն՝ ապացույցների ուժը (կշռված ըստ աղբյուրների), աղբյուրների համաձայնեցվածությունը, անկախ մեդիա խմբերի քանակը, թեմայի լուսաբանման լայնությունը և հակափաստարկների առկայությունը:

Այս միավորը ցույց է տալիս, թե որքան ապացույց կա եզրակացության հետևում: «Հաստատված» եզրակացությունը 90% վստահությամբ նշանակում է շատ ամուր հիմքեր, իսկ 55% վստահությամբ՝ ավելի թույլ ապացուցողական բազա:

Եզրակացության մակարդակներ

Յուրաքանչյուր փաստի ստուգում ավարտվում է հինգ եզրակացության մակարդակներից մեկով: Եզրակացությունը որոշվում է AI մոդելի կողմից՝ հիմնվելով գտնված ապացույցների վրա:

Հաստատված

Պնդումը լիովին հաստատված է բազմաթիվ վստահելի աղբյուրների կողմից: Տեղեկությունը հաստատվել է պաշտոնական փաստաթղթերով կամ անկախ լրատվամիջոցների հուսալի հրապարակումներով:

Մեծամասամբ ճիշտ

Պնդման հիմքը ճիշտ է, սակայն այն պարունակում է աննշան անճշտություններ կամ բացակայում է որոշակի համատեքստ: Էական մասը վավեր է, բայց որոշ մանրամասներ լիովին չեն համապատասխանում առկա ապացույցներին:

Մոլորեցնող

Պնդումը պարունակում է իրական փաստեր, բայց դրանք աղավաղված են, ներկայացված են ընտրողաբար կամ այնպիսի ձևակերպմամբ, որը ստեղծում է սխալ տպավորություն: Սա ներառում է նաև որպես փաստ մատուցվող քաղաքական կարծիքները:

Հերքված

Պնդումը ուղղակիորեն հակասում է վստահելի ապացույցներին: Առկա փաստերը ցույց են տալիս, որ պնդումը կեղծ է կամ խիստ աղավաղված:

Ստուգել հնարավոր չէ

Բավարար ապացույցներ չկան պնդումը հաստատելու կամ հերքելու համար: Շտեմարանում առկա չէ համապատասխան տեղեկատվություն, կամ պնդումը բավարար չափով չի համընկնում որևէ աղբյուրի հետ:

Վստահության միավոր

Վստահության միավորը (0–100%) հաշվարկվում է մաթեմատիկական բանաձևով, որը լիովին անկախ է AI մոդելից: Այն ներկայացնում է զուտ թվային չափանիշ, թե որքան ամուր են հայտնաբերված ապացույցները:

Միավոր = WE × Consistency × Diversity × ClusterCoverage × (1 − CP)

WE

Կշռված ապացույցներ

Որքան ամուր են ապացույցները՝ հաշվի առնելով յուրաքանչյուր աղբյուրի վստահելիությունը

Consistency

Համաձայնեցվածություն

Արդյո՞ք աղբյուրները համակարծիք են: Եթե բոլոր աղբյուրները նույնն են պնդում, միավորը բարձրանում է:

Diversity

Բազմազանություն

Քանի անկախ մեդիա խումբ է հաստատում տեղեկությունը: Լիարժեք հաստատման համար անհրաժեշտ է առնվազն 3 անկախ խումբ:

ClusterCoverage

Թեմայի ընդգրկում

Որքան լայնորեն է լուսաբանվել թեման: Շատ աղբյուրների կողմից լուսաբանված դեպքերը ստանում են լրացուցիչ միավոր:

1 − CP

Հակափաստարկի տուգանք

Նվազեցնում է միավորը, երբ առկա են հիմնավոր հակափաստարկներ: Առավելագույն տուգանքը կարող է կազմել մինչև 25%:

Ինչպես հասկանալ վստահության միավորը

• 80–100% — Շատ ամուր ապացույցներ բազմաթիվ անկախ և վստահելի աղբյուրներից:

• 60–79% — Լավ ապացույցներ, բայց կարող են հիմնված լինել քիչ կամ խառը վստահելիության աղբյուրների վրա:

• 40–59% — Սահմանափակ ապացույցներ: Որոշ աղբյուրներ հաստատում են, բայց բազմազանությունը պակասում է:

• 40%-ից ցածր — Թույլ ապացույցներ: Գտնվել են շատ քիչ առնչվող աղբյուրներ:

• 10% — Նվազագույն միավոր: Շտեմարանում տվյալ պնդման վերաբերյալ որևէ առնչվող տեղեկություն չի գտնվել:

Պատկերի ստուգում

Պատկերի ստուգումն իրականացվում է Geniale մոդելի միջոցով (SigLIP + DINOv2 fusion), որն էլ ձևավորում է վերջնական եզրակացությունը։ Այն համալրված է ELA և սպեկտրալ վերլուծություններով։

Geniale դետեկտոր (SigLIP + DINOv2)

Պատկերի մշակումն իրականացվում է Geniale մոդելի միջոցով (SigLIP + DINOv2 fusion), որն էլ ձևավորում է վերջնական եզրակացությունը: Շեմը՝ 0.60 — միավորը ≥ 0.60 → սինթետիկ (AI), միավորը < 0.60 → իրական:

ELA վերլուծություն

Error Level Analysis-ը հայտնաբերում է սեղմման (compression) անհամապատասխանությունները պատկերներում՝ բացահայտելով թվային փոփոխության ենթարկված կամ մոնտաժված հատվածները:

Սպեկտրալ վերլուծություն

Սպեկտրալ վերլուծությունը հայտնաբերում է AI-ով գեներացված պատկերների կողմից թողնված բնորոշ հետքերը:

Տեսանյութի ստուգում

Տեսանյութի հայտնաբերումն անցնում է բազմաստիճան վերլուծության միջով՝ կադրերի ընտրանք, կադր առ կադր գնահատում, զուգահեռ մոդելների համաձայնության ստուգում, դեմքի առկայության դեպքում՝ լրացուցիչ ֆորենզիկ վերլուծություն, և վերջնական ագրեգացում։ Օգտագործվում են SigLIP + DINOv2 մոդելները, անկախ տարածական ու ժամանակային դետեկտորները և head-v1 ագրեգատորը։ Արդյունքը ներկայացվում է ժամանակային գծապատկերով, որտեղ երևում է յուրաքանչյուր հատվածի միավորը։

Կադրերի ընտրանք (windowed sampling)

Տեսանյութից կադրերն ընտրվում են ժամանակային պատուհանների ռազմավարությամբ (windowed 6×18)՝ ապահովելով ամբողջ տեսանյութի հավասարաչափ ծածկույթը սկզբից մինչև վերջ, ոչ միայն առաջին կադրերի հիման վրա։

Կադր առ կադր գնահատում

Յուրաքանչյուր ընտրված կադրի համար հաշվարկվում է կեղծ լինելու հավանականությունը SigLIP + DINOv2 մոդելների հիման վրա։ Արդյունքը ներկայացվում է ինտերակտիվ ժամանակային գծապատկերով, որտեղ յուրաքանչյուր հատված ունի իր գույնային միավորը։

Բազմա-մոդելային ագրեգացում

Զուգահեռ աշխատում են մի քանի անկախ դետեկտորներ՝ head-v1, v2, տարածական (spatial) և ժամանակային (temporal)։ Վերջնական որոշումը կայացվում է դրանց համաձայնության կամ տարակարծիքության հիման վրա՝ մեծացնելով վստահելիությունը, երբ բոլոր մոդելները միասնական են։

Դեմքի ֆորենզիկ ստուգում

Երբ տեսանյութում հայտնաբերվում է դեմք, միացվում են լրացուցիչ դեմք-կենտրոն վերլուծություններ՝ հատկանշային համապատասխանության, արտեֆակտների և ժամանակային հետևողականության ստուգումներ։ Սա կրիտիկական շերտ է deepfake-ների հայտնաբերման համար։

Վերջնական ագրեգացում (head-v1)

Կադրային միավորները համադրվում են վիճակագրական ցուցանիշներով՝ mean, max, std, p90/p95, fake_ratio, run-length: Head-v1 ագրեգատորը համատեղում է այս ցուցանիշները դետեկտորների որոշումների հետ՝ ստանալով վերջնական շեմային եզրակացություն։

Ստուգման սահմանաչափեր

Սերվերային ծանրաբեռնվածության հավասարակշռված բաշխման համար սահմանված են օրական ստուգումների սահմանաչափեր։ Գրանցվելով օգտվողները ստանում են զգալիորեն ավելի հնարավորություններ։

Չգրանցված օգտվող

Տեքստային ստուգում՝ օրական 3 հարցում
Պատկերի ստուգում՝ օրական 3 պատկեր
Տեսանյութի ստուգում՝ օրական 1 տեսանյութ

Գրանցված օգտվող

Տեքստային ստուգում՝ օրական 10 հարցում
Պատկերի ստուգում՝ օրական 10 պատկեր
Տեսանյութի ստուգում՝ օրական 3 տեսանյութ

* Սահմանաչափերը զրոյացվում են յուրաքանչյուր հաջորդ օրվա համար։ Գրանցվելու համար անհրաժեշտ է մուտք գործել հարթակ։

Հրաժարագիր

STUGEL հարթակը չի փոխարինում փաստերի ստուգման մասնագետների աշխատանքին։ STUGEL-ն օգտագործում է բնական լեզվի մշակման և սինթետիկ մեդիայի հայտնաբերման գործիքներ Ձեր տրամադրած կոնտենտի հավաստիությունը ստուգելու համար։ Մոդելը կարող է սխալվել։ Հնարավոր է՝ տվյալները թերի լինեն կամ մոդելը տրամաբանական/հաշվարկային սխալներ թույլ տա։ STUGEL հարթակի եզրակացությունները կարելի է օգտագործել որպես ուղղորդող, և ոչ որպես բացարձակ եզրահանգում։

Ահա մի քանի սահմանափակում, որոնք պետք է հաշվի առնել՝

•Շտեմարանի ընդգրկում․ Մեր շտեմարանը կարող է չպարունակել տեղեկատվություն բոլոր թեմաների վերաբերյալ: Մենք անընդհատ թարմացնում ենք աղբյուրները, սակայն ընդգրկումը կախված է մեր կողմից մոնիտորինգի ենթարկվող լրատվամիջոցների, լրատվական ռեսուրսների, սոցցանցային էջերի հրապարակումներից, ինչը չի կարող լիարժեք լինել:
•ԱԲ-ն մարդ-փորձագետ չէ․ STUGEL-ը չի փոխարինում պրոֆեսիոնալ փաստեր ստուգողներին: Արդյունքները խորհրդատվական են: Միշտ համեմատեք արդյունքներն այլ աղբյուրների հետ:
•Համատեքստի զգայունություն․ Սարկազմը, հեգնանքը և մշակութային նրբությունները կարող են ազդել վերլուծության ճշգրտության վրա: Համակարգը լավագույնս աշխատում է հստակ փաստացի պնդումների հետ:
•Լայնորեն տարածված կեղծ պնդումներ․ Եթե կեղծ պնդումը լայնորեն տարածված է բազմաթիվ լրատվամիջոցներում և հատկապես՝ տեղ է գտել փաստեր ստուգող հեղինակավոր աղբյուրներում, կա հավանականություն, որ մոդելի կողմից պնդումը կհամարվի ճշմարիտ, քանի որ մոդելն արտացոլում է տեղեկատվության ծավալը և որակը, այլ ոչ թե եղելությունը:
•Մեդիա ստուգման որակ․ Պատկերի և տեսանյութի ստուգման ճշգրտությունը կախված է ֆայլի որակից: Նորագույն սերնդի բարձրորակ մոդելներով գեներացված դիփֆեյքերը կարող են խուսափել հայտնաբերումից: Մենք պարբերաբար աշխատում ենք թարմացնել դիփֆեյքեր հայտնաբերող սենսորները։

Մեթոդաբանություն