Մեթոդաբանություն

Ինչպե՞ս է STUGEL-ը ստուգում Ձեր տրամադրած բովանդակությունը.

քայլ առ քայլ՝ հարցումից մինչև եզրակացություն։

Տեքստային բովանդակության ստուգում

Երբ Դուք ներմուծում եք տեքստային պնդում (այդ թվում՝ ձայնային տարբերակով, որը վերածվում է տեքստի), STUGEL-ն այն անցկացնում է 9-փուլանոց ստուգման շղթայով: Յուրաքանչյուր քայլ ավելացնում է վերլուծության նոր շերտ՝ ձեր մուտքագրած տեքստից մինչև մաթեմատիկական վստահության միավորով եզրակացություն:

01

Մուտքագրված տվյալների ընկալում

Երբ Դուք ուղարկում եք տեքստը, համակարգը նախ որոշում է դրա բնույթը: Կան մի քանի հնարավոր տարբերակներ.

• Եթե հաղորդագրությունը պարունակում է կոնկրետ փաստացի պնդում (իրադարձություն, մեջբերում, վիճակագրություն, քաղաքական հայտարարություն), այն անմիջապես անցնում է փաստերի ստուգման փուլ:

• Եթե հաղորդագրությունը չափազանց անորոշ է կամ բաղկացած է միմյանց հետո տրամաբանորեն չկածպված բառերից, համակարգը խնդրում է ձեզ տրամադրել ավելի մանրամասն տեղեկություն:

• Եթե հաղորդագրությունը ողջույն է կամ ընդհանուր բնույթի զրույց, համակարգը պատասխանում է անմիջապես՝ ջերմորեն զրուցելով Ձեզ հետ:

• Սուբյեկտիվ կարծիքները, անձնական բնույթի հարցերը, մասնավոր խնդիրները և աբստրակտ հարցումները դասակարգվում են որպես փաստերի ստուգման համար ոչ ենթակա հաղորդագրություններ, և համակարգը բացատրում է պատճառը, թե ինչու չի կարող ստուգել դրանք:

Կասկածի դեպքում համակարգը միշտ նախապատվությունը տալիս է փաստերի ստուգմանը: Այն նախագծված է ստուգելու, այլ ոչ թե մերժելու համար:

02

Պնդումների տարանջատում

Շատ պնդումներ պարունակում են մեկ նախադասության մեջ խտացված մի քանի փաստացի հայտարարություններ կամ պնդումներ: Նախքան ստուգումը սկսելը, համակարգը բարդ նախադասությունները բաժանում է անկախ, առանձին ենթապնդումների, որոնցից յուրաքանչյուրը կարող է ստուգվել առանձին:

Օրինակ՝ «Պաշտոնյան հայտարարել է, որ բալային համակարգի ներդրման արդյունքում ճանապարհային պատահարների թիվը կրկնակի նվազել է» նախադասությունը վերածվում է երկու առանձին ստուգման ենթական պնդման.

1) Արդյո՞ք պաշտոնյան իրականում արել է նման հայտարարություն (հայտարարության աղբյուրի ստուգում):

2) Արդյո՞ք իրականում բալային համակարգի ներդրման արդյունքում ճանապարհային պատահարների թիվը կրկնակի նվազել է (փաստի ստուգում):

Յուրաքանչյուր ենթապնդում գնահատվում է ըստ հանրային հետաքրքրության կարևորության (քաղաքականություն, անվտանգություն, առողջապահություն, տնտեսություն և այլն), և ամենաազդեցիկները ստուգվում են առաջնահերթ: Մինչև 3 ենթապնդում ստուգվում են զուգահեռաբար, իսկ դրանց արդյունքները համադրվում են:

03

Որոնում անկախ շտեմարաններում

Յուրաքանչյուր ենթապնդում միաժամանակ որոնվում է չորս անկախ տվյալների շերտերում՝ օգտագործելով սեմանտիկ (իմաստային) որոնում, այլ ոչ թե պարզ բառային համընկնում: Համակարգը ձեր պնդումը վերածում է դրա իմաստի մաթեմատիկական պատկերման և գտնում է մոտակա համընկնումները.

Ա) Լրատվական հոդվածների շտեմարան՝ մշտապես թարմացվող շտեմարան հայկական և միջազգային լրատվամիջոցներից: Սա ապացույցների հիմնական աղբյուրն է:

Բ) Հայտնի ապատեղեկատվության օրինաչափություններ — Նախկինում բացահայտված կեղծ լուրերի և ապատեղեկատվական արշավների համակարգված շտեմարան:

Գ) Նախկին փաստերի ստուգման արդյունքներ — Վստահելի փաստերի ստուգման կազմակերպությունների եզրակացություններ:

Դ) Թեմատիկ կլաստերների ամփոփագրեր — Նույն թեմայով հոդվածների խմբերը ավտոմատ կերպով խմբվորվում և ամփոփվում են՝ ապահովելով ավելի լայն համատեքստ:

Ե) Եթե հարցմանը վերաբերելի համընկնումներ վերոնշյալ շտեմարաններում չեն հայտնաբերվում, ապա մոդելը իրականացնում է արագ որոնում համացանցում։

04

Աղբյուրի վստահելիության գնահատում

Ոչ բոլոր աղբյուրներն ունեն հավասար վստահելիության մակարդակ: Համակարգը գնահատում է յուրաքանչյուր աղբյուր մի քանի չափորոշիչներով.

• Վստահելիության մակարդակ — Մոդելն ինքնաշխատ եղանակով վերլուծում է նախկինում հայտնաբերված ապատեղեկատվության աղբյուր հանդիսացած կամ դրա տարածմանը նպաստած ռեսուրսները, յուրաքանչյուր դեպքում հատկացնում է տուգանքի միավորներ և դասակարգվում է «Շատ բարձր»-ից մինչև «Շատ ցածր»:

• Հրապարակման ամսաթիվ — Թարմ հոդվածներն ավելի մեծ կշիռ ունեն, քան հները: Մեկ տարուց ավելի հնություն ունեցող հոդվածները դեռ հաշվի են առնվում, բայց ունեն նվազագույն ազդեցություն:

• Աղբյուրների բազմազանություն — Համակարգը ստուգում է, թե քանի անկախ մեդիա խումբ է ներկայացված: Միևնույն մեդիա խմբի հինգ հոդվածը հաշվվում է որպես մեկ ձայն, այլ ոչ թե հինգ անկախ հաստատում:

• Բնօրինակ vs Վերատպում — Տեղեկատվության առաջնային աղբյուրը (բնօրինակը հրապարակողը) ստանում է լրացուցիչ առավելություն վերատպողների նկատմամբ: Միևնույն տրամաբանությամբ ապատեղեկատվության դեպքում բնօրինակը ստանում է ավելի շատ տուգանային միավոր, քան տարածողը։

05

Կողմնակալության և մանիպուլյացիայի հայտնաբերում

Փաստացի ստուգումից զատ, համակարգը վերլուծում է նաև պնդման շարադրանքը: Այն փնտրում է հռետորական հնարքներ, որոնք կարող են վկայել մանիպուլյացիայի մասին.

• Հուզական լեզու — Բառեր, որոնք նախատեսված են վախ, զայրույթ կամ համակրանք հարուցելու համար:

• Միակողմանի ներկայացում — Միայն մեկ տեսանկյունի մատուցում՝ բաց թողնելով հակադիր փաստարկները:

• Սենսացիոնալիզմ — Չափազանցություն կամ դրամատիզացում, որը դուրս է փաստերի սահմանից:

• Ուղղորդված տերմիններ — Կանխակալ լեզու, որն իր մեջ կրում է թաքնված դատողություն:

Կողմնակալության մակարդակը հաշվի է առնվում վերջնական եզրակացության մեջ որպես մոլորեցնող համատեքստի ապացույց, նույնիսկ եթե հիմնական փաստերը մասամբ ճիշտ են:

06

Հակափաստարկների որոնում

Հավասարակշռված վերլուծություն ապահովելու համար համակարգը ակտիվորեն փնտրում է հակադիր տեսակետներ: Եթե ապացույցները պաշտպանում են պնդումը, այն փնտրում է աղբյուրներ, որոնք հերքում են այն, և հակառակը:

Այս քայլը վճռորոշ է հավասարակշռված գնահատականի համար: Գտնված հակափաստարկների քանակը ազդում է վստահության միավորի վրա. որքան շատ են հիմնավոր հակադիր տեսակետները, այնքան ցածր է վստահության միավորը՝ արտացոլելով իրական անորոշությունը:

Եթե որևէ հիմնավոր հակափաստարկ գոյություն չունի (օրինակ՝ համընդհանուր ընդունված փաստերի դեպքում), վստահության միավորը չի նվազում:

07

Վերջնական եզրակացության ձևավորում

Բոլոր հավաքագրված ապացույցները փոխանցվում են հզոր լեզվական մոդելին (Gemini), որը գնահատում է ամեն ինչ և տալիս է եզրակացություն՝ հետևելով խիստ կանոնների.

• Եթե ոչ մի աղբյուր ուղղակիորեն չի վկայում իրադարձության մասին կամ շտեմարաններում հայտնաբերված նյութերը ունենում են խիստ սակավ նմանություն պնդմանը, ապա եզրակացությունը լինում է՝ «Ստուգել հնարավոր չէ»:

• Եթե հարցման մեջ առկա են մեկից ավել պնդումներ, ապա մոդելը առկա առավելագույնը 3 ամենակարևոր պնդումները ստուգում է առանձին-առանձին։ Դրանից հետո համադրում է երեք պնդումների եզրակացությունները և գեներացնում է վերջնական, միասնական եզրակացությունը, որն արդեն վերաբերում է ամբողջական հարցման տեքստին։

• Եթե հարցման մեջ առկա փաստահեն պնդումների համեմատ գերակշռում են սուբյեկտիվ, կողմնակալ ձևակերպումները, ապա մոդելը եզրակացության մեջ ընդգծում է տվյալ հանգամանքը՝ առավելապես հակվելով հարցման տեքստի մանիպուլատիվ բնույթի արձանագրմանը։

• Մոդելը հայտնաբերված ապացույցների հետ մեկտեղ համադրում է նաև այդ ապացույցները վկայակոչող աղբյուրների հեղինակությունը, որը հաշվարկվում է ինքնաշխատ կերպով։

• Կախված ապացույցների ժամանակային թարմությունից, դեմ և կողմ փաստերի համադրությունից, ռեսուրսների հեղինակությունից՝ խոշոր լեզվական մոդելը կատարում է տրամաբանական դատողություն և գեներացնում է եզրակացությունը ուղարկված տեքստային կոնտենտի հավաստիության վերաբերյալ։

• Եզրակացությանը կցվում է «Հաստատված», «Մեծամասամբ ճիշտ», «Մոլորեցնող», «Հերքված» կամ «Ստուգել հնարավոր չէ» պիտակներից մեկը։

08

Մաթեմատիկական վստահության միավոր

Եզրակացությունից զատ, հաշվարկվում է դրա վստահության միավորը (0–100%): Այս միավորի վրա լեզվական մոդելը չի կարող ազդել. այն մաքուր մաթեմատիկական հաշվարկ է՝ հիմնված գտնված ապացույցների վրա:

Բանաձևը համադրում է հինգ գործոն՝ ապացույցների ուժը (կշռված ըստ աղբյուրների), աղբյուրների համաձայնեցվածությունը, անկախ մեդիա խմբերի քանակը, թեմայի լուսաբանման լայնությունը և հակափաստարկների առկայությունը:

Այս միավորը ցույց է տալիս, թե որքան ապացույց կա եզրակացության հետևում: «Հաստատված» եզրակացությունը 90% վստահությամբ նշանակում է շատ ամուր հիմքեր, իսկ 55% վստահությամբ՝ ավելի թույլ ապացուցողական բազա:

Եզրակացության մակարդակներ

Յուրաքանչյուր փաստի ստուգում ավարտվում է հինգ եզրակացության մակարդակներից մեկով: Եզրակացությունը որոշվում է AI մոդելի կողմից՝ հիմնվելով գտնված ապացույցների վրա:

Հաստատված

Պնդումը լիովին հաստատված է բազմաթիվ վստահելի աղբյուրների կողմից: Տեղեկությունը հաստատվել է պաշտոնական փաստաթղթերով կամ անկախ լրատվամիջոցների հուսալի հրապարակումներով:

Մեծամասամբ ճիշտ

Պնդման հիմքը ճիշտ է, սակայն այն պարունակում է աննշան անճշտություններ կամ բացակայում է որոշակի համատեքստ: Էական մասը վավեր է, բայց որոշ մանրամասներ լիովին չեն համապատասխանում առկա ապացույցներին:

Մոլորեցնող

Պնդումը պարունակում է իրական փաստեր, բայց դրանք աղավաղված են, ներկայացված են ընտրողաբար կամ այնպիսի ձևակերպմամբ, որը ստեղծում է սխալ տպավորություն: Սա ներառում է նաև որպես փաստ մատուցվող քաղաքական կարծիքները:

Հերքված

Պնդումը ուղղակիորեն հակասում է վստահելի ապացույցներին: Առկա փաստերը ցույց են տալիս, որ պնդումը կեղծ է կամ խիստ աղավաղված:

Ստուգել հնարավոր չէ

Բավարար ապացույցներ չկան պնդումը հաստատելու կամ հերքելու համար: Շտեմարանում առկա չէ համապատասխան տեղեկատվություն, կամ պնդումը բավարար չափով չի համընկնում որևէ աղբյուրի հետ:

Վստահության միավոր

Վստահության միավորը (0–100%) հաշվարկվում է մաթեմատիկական բանաձևով, որը լիովին անկախ է AI մոդելից: Այն ներկայացնում է զուտ թվային չափանիշ, թե որքան ամուր են հայտնաբերված ապացույցները:

Միավոր = WE × Consistency × Diversity × ClusterCoverage × (1 − CP)
WE

Կշռված ապացույցներ

Որքան ամուր են ապացույցները՝ հաշվի առնելով յուրաքանչյուր աղբյուրի վստահելիությունը

Consistency

Համաձայնեցվածություն

Արդյո՞ք աղբյուրները համակարծիք են: Եթե բոլոր աղբյուրները նույնն են պնդում, միավորը բարձրանում է:

Diversity

Բազմազանություն

Քանի անկախ մեդիա խումբ է հաստատում տեղեկությունը: Լիարժեք հաստատման համար անհրաժեշտ է առնվազն 3 անկախ խումբ:

ClusterCoverage

Թեմայի ընդգրկում

Որքան լայնորեն է լուսաբանվել թեման: Շատ աղբյուրների կողմից լուսաբանված դեպքերը ստանում են լրացուցիչ միավոր:

1 − CP

Հակափաստարկի տուգանք

Նվազեցնում է միավորը, երբ առկա են հիմնավոր հակափաստարկներ: Առավելագույն տուգանքը կարող է կազմել մինչև 25%:

Ինչպես հասկանալ վստահության միավորը

80–100% — Շատ ամուր ապացույցներ բազմաթիվ անկախ և վստահելի աղբյուրներից:

60–79% — Լավ ապացույցներ, բայց կարող են հիմնված լինել քիչ կամ խառը վստահելիության աղբյուրների վրա:

40–59% — Սահմանափակ ապացույցներ: Որոշ աղբյուրներ հաստատում են, բայց բազմազանությունը պակասում է:

40%-ից ցածր — Թույլ ապացույցներ: Գտնվել են շատ քիչ առնչվող աղբյուրներ:

10% — Նվազագույն միավոր: Շտեմարանում տվյալ պնդման վերաբերյալ որևէ առնչվող տեղեկություն չի գտնվել:

Պատկերի ստուգում

Պատկերի ստուգումն իրականացվում է Geniale մոդելի միջոցով (SigLIP + DINOv2 fusion), որն էլ ձևավորում է վերջնական եզրակացությունը։ Այն համալրված է ELA և սպեկտրալ վերլուծություններով։

Geniale դետեկտոր (SigLIP + DINOv2)

Պատկերի մշակումն իրականացվում է Geniale մոդելի միջոցով (SigLIP + DINOv2 fusion), որն էլ ձևավորում է վերջնական եզրակացությունը: Շեմը՝ 0.60 — միավորը ≥ 0.60 → սինթետիկ (AI), միավորը < 0.60 → իրական:

ELA վերլուծություն

Error Level Analysis-ը հայտնաբերում է սեղմման (compression) անհամապատասխանությունները պատկերներում՝ բացահայտելով թվային փոփոխության ենթարկված կամ մոնտաժված հատվածները:

Սպեկտրալ վերլուծություն

Սպեկտրալ վերլուծությունը հայտնաբերում է AI-ով գեներացված պատկերների կողմից թողնված բնորոշ հետքերը:

Տեսանյութի ստուգում

Տեսանյութի հայտնաբերումն անցնում է բազմաստիճան վերլուծության միջով՝ կադրերի ընտրանք, կադր առ կադր գնահատում, զուգահեռ մոդելների համաձայնության ստուգում, դեմքի առկայության դեպքում՝ լրացուցիչ ֆորենզիկ վերլուծություն, և վերջնական ագրեգացում։ Օգտագործվում են SigLIP + DINOv2 մոդելները, անկախ տարածական ու ժամանակային դետեկտորները և head-v1 ագրեգատորը։ Արդյունքը ներկայացվում է ժամանակային գծապատկերով, որտեղ երևում է յուրաքանչյուր հատվածի միավորը։

Կադրերի ընտրանք (windowed sampling)

Տեսանյութից կադրերն ընտրվում են ժամանակային պատուհանների ռազմավարությամբ (windowed 6×18)՝ ապահովելով ամբողջ տեսանյութի հավասարաչափ ծածկույթը սկզբից մինչև վերջ, ոչ միայն առաջին կադրերի հիման վրա։

Կադր առ կադր գնահատում

Յուրաքանչյուր ընտրված կադրի համար հաշվարկվում է կեղծ լինելու հավանականությունը SigLIP + DINOv2 մոդելների հիման վրա։ Արդյունքը ներկայացվում է ինտերակտիվ ժամանակային գծապատկերով, որտեղ յուրաքանչյուր հատված ունի իր գույնային միավորը։

Բազմա-մոդելային ագրեգացում

Զուգահեռ աշխատում են մի քանի անկախ դետեկտորներ՝ head-v1, v2, տարածական (spatial) և ժամանակային (temporal)։ Վերջնական որոշումը կայացվում է դրանց համաձայնության կամ տարակարծիքության հիման վրա՝ մեծացնելով վստահելիությունը, երբ բոլոր մոդելները միասնական են։

Դեմքի ֆորենզիկ ստուգում

Երբ տեսանյութում հայտնաբերվում է դեմք, միացվում են լրացուցիչ դեմք-կենտրոն վերլուծություններ՝ հատկանշային համապատասխանության, արտեֆակտների և ժամանակային հետևողականության ստուգումներ։ Սա կրիտիկական շերտ է deepfake-ների հայտնաբերման համար։

Վերջնական ագրեգացում (head-v1)

Կադրային միավորները համադրվում են վիճակագրական ցուցանիշներով՝ mean, max, std, p90/p95, fake_ratio, run-length: Head-v1 ագրեգատորը համատեղում է այս ցուցանիշները դետեկտորների որոշումների հետ՝ ստանալով վերջնական շեմային եզրակացություն։

Ստուգման սահմանաչափեր

Սերվերային ծանրաբեռնվածության հավասարակշռված բաշխման համար սահմանված են օրական ստուգումների սահմանաչափեր։ Գրանցվելով օգտվողները ստանում են զգալիորեն ավելի հնարավորություններ։

Չգրանցված օգտվող

  • Տեքստային ստուգում՝ օրական 3 հարցում
  • Պատկերի ստուգում՝ օրական 3 պատկեր
  • Տեսանյութի ստուգում՝ օրական 1 տեսանյութ

Գրանցված օգտվող

  • Տեքստային ստուգում՝ օրական 10 հարցում
  • Պատկերի ստուգում՝ օրական 10 պատկեր
  • Տեսանյութի ստուգում՝ օրական 3 տեսանյութ

* Սահմանաչափերը զրոյացվում են յուրաքանչյուր հաջորդ օրվա համար։ Գրանցվելու համար անհրաժեշտ է մուտք գործել հարթակ։

Հրաժարագիր

    STUGEL հարթակը չի փոխարինում փաստերի ստուգման մասնագետների աշխատանքին։ STUGEL-ն օգտագործում է բնական լեզվի մշակման և սինթետիկ մեդիայի հայտնաբերման գործիքներ Ձեր տրամադրած կոնտենտի հավաստիությունը ստուգելու համար։ Մոդելը կարող է սխալվել։ Հնարավոր է՝ տվյալները թերի լինեն կամ մոդելը տրամաբանական/հաշվարկային սխալներ թույլ տա։ STUGEL հարթակի եզրակացությունները կարելի է օգտագործել որպես ուղղորդող, և ոչ որպես բացարձակ եզրահանգում։

    Ահա մի քանի սահմանափակում, որոնք պետք է հաշվի առնել՝

  • Շտեմարանի ընդգրկում․ Մեր շտեմարանը կարող է չպարունակել տեղեկատվություն բոլոր թեմաների վերաբերյալ: Մենք անընդհատ թարմացնում ենք աղբյուրները, սակայն ընդգրկումը կախված է մեր կողմից մոնիտորինգի ենթարկվող լրատվամիջոցների, լրատվական ռեսուրսների, սոցցանցային էջերի հրապարակումներից, ինչը չի կարող լիարժեք լինել:
  • ԱԲ-ն մարդ-փորձագետ չէ․ STUGEL-ը չի փոխարինում պրոֆեսիոնալ փաստեր ստուգողներին: Արդյունքները խորհրդատվական են: Միշտ համեմատեք արդյունքներն այլ աղբյուրների հետ:
  • Համատեքստի զգայունություն․ Սարկազմը, հեգնանքը և մշակութային նրբությունները կարող են ազդել վերլուծության ճշգրտության վրա: Համակարգը լավագույնս աշխատում է հստակ փաստացի պնդումների հետ:
  • Լայնորեն տարածված կեղծ պնդումներ․ Եթե կեղծ պնդումը լայնորեն տարածված է բազմաթիվ լրատվամիջոցներում և հատկապես՝ տեղ է գտել փաստեր ստուգող հեղինակավոր աղբյուրներում, կա հավանականություն, որ մոդելի կողմից պնդումը կհամարվի ճշմարիտ, քանի որ մոդելն արտացոլում է տեղեկատվության ծավալը և որակը, այլ ոչ թե եղելությունը:
  • Մեդիա ստուգման որակ․ Պատկերի և տեսանյութի ստուգման ճշգրտությունը կախված է ֆայլի որակից: Նորագույն սերնդի բարձրորակ մոդելներով գեներացված դիփֆեյքերը կարող են խուսափել հայտնաբերումից: Մենք պարբերաբար աշխատում ենք թարմացնել դիփֆեյքեր հայտնաբերող սենսորները։