प्रसंग में: शोधकर्ता रचनात्मक दुनिया में क्रांति ला रहे हैं, कई कार्यों को अर्ध-स्वायत्त प्रक्रियाओं में बदलने के लिए कृत्रिम बुद्धिमत्ता और मशीन लर्निंग एल्गोरिदम का शोषण कर रहे हैं। जनरेटिव एआई से अब कुछ भी सुरक्षित नहीं है, यहां तक कि आपके स्थानीय डॉक्टर की अस्पष्ट लिखावट भी नहीं।
OpenAI और अन्य संगठनों द्वारा टेक्स्ट, स्पीच, आर्टवर्क, मालवेयर और वीडियो को आसानी से उत्पन्न करने के लिए AI के साथ छेड़छाड़ शुरू करने के वर्षों पहले, मशीन लर्निंग शोधकर्ता सीन वास्केज़ “हैंडराइटिंग सिंथेसिस” प्रयोग बनाने के लिए Google DeepMind के एलेक्स ग्रेव्स द्वारा 2013 के एक पेपर का अध्ययन कर रहे थे।
वास्केज़ ने अपने वेब-आधारित डेमो के साथ गिटहब पर अपना कोड संग्रहीत किया। प्रयोग Calligrapher.ai पर उपलब्ध है, जिसे हैकर न्यूज ने हाल ही में फिर से खोजा। Calligrapher.ai के पीछे लिखावट संश्लेषण एक आवर्तक तंत्रिका नेटवर्क (RNN) पर आधारित एक जनरेटिव विधि को नियोजित करता है।
आरएनएन कृत्रिम तंत्रिका नेटवर्क का एक वर्ग है जहां नोड्स के बीच कनेक्शन एक लूप बना सकता है जो कुछ नोड्स से आउटपुट को समान नोड्स के बाद के इनपुट को प्रभावित करने की अनुमति देता है। आवर्तक तंत्रिका नेटवर्क समय के साथ गतिशील व्यवहार प्रदर्शित कर सकते हैं, जिससे वे हस्तलेखन या वाक् पहचान जैसे कार्यों के लिए विशेष रूप से उपयोगी हो जाते हैं। किसी भी अन्य तंत्रिका नेटवर्क की तरह, वास्केज़ ने कैलीग्राफर.ई को सुलेख नमूनों के एक मामूली बड़े डेटासेट पर प्रशिक्षित किया, मुख्य रूप से IAM का ऑनलाइन हस्तलेखन डेटाबेस।
आईएएम-ऑन डेटाबेस में “ब्लैकबोर्ड पर अधिग्रहीत पाठ के अंग्रेजी हस्तलिखित रूप” शामिल हैं, जिसमें 221 विभिन्न “लेखकों” के नमूने और 1700 से अधिक अधिग्रहीत प्रपत्र शामिल हैं। डेटाबेस में 11,059 शब्दों के शब्दकोश से कुल 86,272 नमूनों के लिए “ऑन-लाइन” और “ऑफ़-लाइन” प्रारूप में पाठ की 13,049 पृथक और लेबल वाली पंक्तियाँ शामिल हैं।
Calligrapher.ai 9 अलग-अलग शैलियों में चर लिखावट उत्पन्न कर सकता है, जबकि उपयोगकर्ता आगे के अनुकूलन के लिए गति, पठनीयता और स्ट्रोक की चौड़ाई के लिए स्लाइडर्स को बदल सकते हैं। लिखावट की नकल करने के लिए डिज़ाइन किए गए पारंपरिक फ़ॉन्ट प्रकारों के विपरीत, Calligrapher.ai द्वारा उत्पन्न प्रत्येक स्वैच अद्वितीय होना चाहिए, भले ही लेखन शैली समान हो। उपयोगकर्ता अंतिम परिणाम को एसवीजी वेक्टर फ़ाइल के रूप में डाउनलोड कर सकते हैं।
वास्केज़ के अनुसार, पठनीयता स्लाइडर लेखन में भिन्नता को बदलने के लिए “नमूना वितरण तापमान समायोजन” नामक एक विधि को नियोजित करता है। परिणाम “संभाव्यता वितरण” से आते हैं और पठनीयता में वृद्धि “सबसे अधिक संभावित परिणामों के आसपास संभावना घनत्व को प्रभावी ढंग से केंद्रित करती है”।
केवल एक डेमो होने के नाते, Calligrapher.ai विश्वसनीय लेखन पैटर्न बनाने की अपनी क्षमता के बावजूद दायरे में सीमित है। इसके अलावा, वास्केज़ ने केवल अंग्रेजी भाषा के नमूनों पर अंतर्निहित आरएनएन को प्रशिक्षित किया, इसलिए वेबसाइट विशेष रूप से अन्य भाषाओं में आमतौर पर उपयोग किए जाने वाले लहजे को पुन: प्रस्तुत करने में अच्छी नहीं है।