[ad_1]
अब तक मैं और आप यह शिकायत करते रहे हैं कि हममें से अधिकतर लोग सड़क, ट्रेन में या सार्वजनिक जगहों पर मोबाइल स्क्रीन में आंखें गड़ाए कुछ न कुछ टाइप करते रहते हैं। लेकिन चिंता न करें, एआई ने आपकी शिकायत सुन ली है। लोग अब आंखों में आंखें डालकर आपको देखेंगे और बात करते रहेंगे। अरे, घबराएं नहीं। वे आपसे नहीं, बल्कि अपने फोन के साथ ही टॉकिंग करेंगे। अब लोग फोन पर किसी दूसरे से बात नहीं कर रहे हैं, बल्कि अपने मोबाइल को डिक्टेशन दे रहे हैं- जो एक सेक्रेटरी की तरह नोट्स ले रहा है और उसे इच्छित लोगों तक भेज रहा है। अब कल्पना कीजिए कि आप मुंबई की खचाखच भरी लोकल ट्रेन में सफर कर रहे हैं और हर कोई अपने मोबाइल से टाॅकिंग कर रहा है। मोबाइल उनकी आवाज पहचान रहा है और उसे मैसेज में बदल रहा है। सोचिए, ट्रेनें कितनी शोरगुल वाली हो जाएंगी? जी हां, दुनिया धीरे-धीरे सैन फ्रांसिस्को के एक स्टार्टअप द्वारा तैयार ‘विस्पर फ्लो’ जैसे एआई डिक्टेशन एप्स की आदी हो जाएगी। यह एआई आपकी बेतरतीब-सी कॉपी में सही स्थानों पर विराम चिह्न लगाएगा और फॉर्मेट करेगा। इसके जरिए आप औसतन 110 से 125 शब्द प्रति मिनट बोल सकते हैं, जो औसत टाइपिंग स्पीड से कम से कम दोगुनी और कभी-कभार तीन गुनी तक हो सकती है। आज के वक्त में हर काम टाइपिंग से हो सकता है। लेकिन सॉफ्टवेयर एजेंसी ‘व्हाई नॉट अस’ के फाउंडर गेविन मैकनमारा 77 एप्स इस्तेमाल कर रहे हैं और बीते पांच महीनों में 3 लाख शब्द बोल चुके हैं। यह तीन उपन्यास लिखने के बराबर है। भविष्य की दुनिया में आपका स्वागत है। यहां टेक दिग्गज चाहते हैं कि हम एआई और लार्ज लैंग्वेज मॉडल्स के इस्तेमाल में ‘टाइपिंग’ की जगह ‘टॉकिंग’ के जरिए तकनीक से बातचीत करें। वॉइस-टु-टेक्स्ट डिक्टेशन एप्स नया ट्रेंड बन रहे हैं, क्योंकि इनका इस्तेमाल टाइपिंग से कहीं ज्यादा तेज है। टेक इंडस्ट्री के नामचीन लोग भी एआई इस्तेमाल करने के नए तरीके बना रहे हैं। मेटा के नए स्मार्ट ग्लासेस पूरी तरह वॉइस पर निर्भर हैं। ओपनएआई और मेटा ने अपने बॉट्स से वॉइस चैट के लिए अलग-अलग पर्सनैलिटी डिजाइन की हैं। अमेजन की एलेक्सा और एप्पल की सिरी तक में एआई अपग्रेड्स हो रहे हैं। 2026 के एमी अवॉर्ड्स की तैयारी भी ऐसी ही तकनीक से की गई। यह सभी बदलाव सुनिश्चित करेंगे कि इस वर्ष के अंत तक हम उंगलियों के इस्तेमाल से ज्यादा तकनीक के साथ बातें करते नजर आएंगे। ये नए डिक्टेशन एप्स एआई मॉडल ‘विस्पर’ पर आधारित हैं। चैटजीपीटी बनाने वाली कंपनी ने 2022 के अंत में इसे बुनियादी तकनीक के तौर पर लॉन्च किया और लाइव डिक्टेशन सुविधा देने के लिए इस पर काम किया। हालांकि इसके कुछ फ्री विकल्प हैं, लेकिन भारत में करीब 500 रुपए महीने तक का पेड सब्स्क्रिप्शन आ सकता है। विकसित देशों में इसकी कीमत लगभग 10 डॉलर हो सकती है। आप अभी भी देख सकते हैं कि एक खास उम्र के टेक यूजर्स ईमेल और एसएमएस के लिए अपने कंप्यूटर से ‘टॉकिंग’ कर रहे हैं। इससे काम तेजी से पूरा होता है। और इसीलिए लोग पेड वर्जन लेने को तैयार हैं। अलग-अलग कंपनियों के कोडर्स भी बड़ी संख्या में इस तकनीक का इस्तेमाल करने लगे हैं, ताकि एक कप कॉफी के लिए समय बचा सकें। वे पहले सारे विचार उड़ेल देते हैं, फिर एआई को कोडिंग करने देते हैं और फाइनल एडिटिंग के लिए खुद की-बोर्ड पर आ जाते हैं। जल्द ही आपको दफ्तरों में ऐसी बातें सुनने को मिल सकती हैं कि ‘हे, आपकी आवाज अच्छी है, लेकिन दफ्तर के लिए नहीं। कार में जाओ और जी भरकर चिल्लाओ।’ समझदार लोग हेडफोन इस्तेमाल कर रहे हैं, ताकि लोग सोचें कि वे कॉल पर हैं। कुल मिलाकर, वे सोशल हैकिंग कर रहे हैं। फंडा यह है कि की-बोर्ड बेकार होने वाला है और हमारे आसपास की दुनिया में पहले से कहीं ज्यादा शोरगुल होगा। हमें बहुत जल्द ध्वनि प्रदूषण के खिलाफ जंग के लिए तैयार रहना होगा।
[ad_2]
एन. रघुरामन का कॉलम: जल्द ही हम ‘टाइपिंग’ की जगह ‘टॉकिंग’ तकनीक का ज्यादा इस्तेमाल करेंगे

