इन्टरनेट गुमनामहरूले भरिएको छ: छद्म नामहरू पछि लुकेका प्रयोगकर्ताहरू – कहिलेकाहीँ राम्रो कारणहरूका लागि, जस्तै स्वतन्त्र रूपमा कुरा गर्न, र कहिलेकाहीँ फोहोर कामहरूका लागि। तर अनलाइन गोपनीयताको यो युगको अन्त्य हुन लागेको देखिन्छ। परीक्षणले देखाउँछ कि ठूला भाषा मोडेलहरू (LLMs) त्यस्ता खाताहरूको मालिकहरूलाई सामूहिक रूपमा पहिचान गर्न सक्षम छन्।

धेरै वर्षदेखि, त्यहाँ एक राय छ कि यद्यपि डि-अनामाइजेसन सैद्धान्तिक रूपमा सम्भव छ, व्यवहारमा यो धेरै समय खपत, जटिल र महँगो छ। अध्ययनका लेखकहरू, माथिको प्रिप्रिन्टमा प्रकाशित arXivएलएलएमलाई यो काम सुम्पन सक्ने बलियो भइसकेको छ भनी अनुमान गरे। तिनीहरूको परिकल्पना परीक्षण गर्न, टोलीले एक स्वचालित प्रणाली विकसित गर्यो जसले अनुसन्धानकर्ताको निर्णय प्रक्रियालाई अनुकरण गर्दछ।
बेनामी मान्छे खोज्नुहोस्
एआईले पहिले रेडिट वा ह्याकर न्यूजमा प्रयोगकर्ताको पोस्टिङ इतिहासलाई असंरचित पाठको जाँच गरेर विश्लेषण गर्नेछ। यो कच्चा, असंगठित जानकारी हो: टिप्पणी, चुटकुले, शिक्षा को सन्दर्भ, र लेखन शैली को सूक्ष्मता। यसले त्यसपछि यो माइक्रो-डेटालाई व्यक्तिको प्रोफाइलको गणितीय प्रतिनिधित्वमा रूपान्तरण गर्दछ लाखौं अन्य प्रोफाइलहरू बीच सम्भावित मिलानहरू फेला पार्नको लागि – दुबै सार्वजनिक वेबमा र LinkedIn जस्ता व्यक्तिगत साइटहरूमा।
जब AI ले मिल्दोजुल्दो फेला पार्छ, यसले प्रमाण तौल गर्छ कि दुबै प्रोफाइल एउटै व्यक्तिको हो। मोडेलले त्यसपछि आफ्नो पूर्वानुमानमा आत्मविश्वास स्कोर प्रदान गर्दछ। यदि उनी नतिजाको बारेमा निश्चित छैन भने, उनले केहि पनि दिनेछैनन्। यसले प्रणालीले अनियमित अनुमानहरू गरिरहेको छैन भनेर सुनिश्चित गर्न मद्दत गर्दछ।
अन्वेषकहरूले लगभग 1,000 LinkedIn प्रोफाइलहरूमा आफ्नो प्रणाली परीक्षण गरे कि यो तिनीहरूलाई ह्याकर समाचारमा खाताहरूसँग मेल खान सक्छ। परीक्षणको लागि, प्रोफाइलहरू चयन गरिएको थियो जुन समूहमा परिचित वास्तविक व्यक्तिहरूसँग सम्बन्ध थियो; प्रयोग सुरु हुनु अघि, तिनीहरूको नाम, सम्बद्धता, र अन्य स्पष्ट पहिचान जानकारी तिनीहरूको प्रोफाइलबाट हटाइयो।
खेल सफल भयो
AI-संचालित प्रणालीले 90% आत्मविश्वास स्तरमा 67% शुद्धताका साथ खाताहरूलाई सफलतापूर्वक लिङ्क गर्यो। त्यो हो, जब मोडेलसँग यसको जवाफहरूमा 90% वा बढी विश्वास हुन्छ, यसको भविष्यवाणीहरूको शुद्धता दर 67% हुन्छ। त्यस्ता कार्यहरूमा AI प्रयोग नगर्ने उत्तम अभ्यासहरूले शायद नै कुनै नतिजा ल्याउनेछ।
AI ले मानिसहरूलाई विभिन्न Reddit समुदायहरूमा जडान गर्न सक्छ, भले पनि प्रयोगकर्ताहरूले तिनीहरूको गतिविधि विभिन्न खाताहरू र समय अवधिहरूमा फैलाए पनि। अन्वेषकहरूले अनुमान गर्छन् कि प्रयोगकर्ताहरू पहिचान गर्न सस्तो छ: प्रति सफलतापूर्वक डि-अनामाइज खाता प्रति कम्प्युटिङ पावरको $ 1 र $ 4 बीच।
“व्यावहारिक अदृश्यता, जसले प्रयोगकर्ताहरूलाई लामो समयको लागि छद्म नामको साथ सुरक्षित गरेको छ … अब काम गर्दैन,” अध्ययनका लेखकहरू संक्षेपमा लेख्छन्। “स्थायी प्रबन्धन अन्तर्गत पोस्ट गर्ने प्रयोगकर्ताहरूले आक्रमणकारीहरूले उनीहरूको खाताहरू वास्तविक व्यक्ति वा एकअर्कासँग लिङ्क गर्न सक्छन् भन्ने मान्नुपर्दछ, र तिनीहरूले प्रकाशित गरेको प्रत्येक माइक्रोडाटाको साथ यसको सम्भावना बढ्छ।”
परिणामहरूले देखाउँछ कि थप विकासको साथ, यो प्रणाली धेरै क्षेत्रहरूमा लागू गर्न सकिन्छ, जस्तै कानून प्रवर्तन र साइबर सुरक्षा।


