زبان فارسی، پنجمین زبان وب است
زبان فارسی، پنجمین زبان وب است
هدی قوامی پور - ایرنا- طبق آمار W۳TeECH، طی نیمه اول سال ۲۰۲۱ و با گذار از یک نزول ناگهانی، زبان فارسی دوباره روند صعودی خود را در پیش گرفته و با کسب سهم ۳.۴ درصدی همچنان پنجمین زبان وب است.

طبق آمار W۳TeECH، در سال ۲۰۱۹ برای نخستین بار در تاریخ، زبان فارسی یکی از ۵ زبان اول پرکاربرد در وب با رشد ویژه­ای همراه شد و به سهم ۳.۸ درصدی از وب رسید، اما این وضعیت در نیمه دوم سال ۲۰۲۰ روند کاهشی به خود گرفت که می‌توان علت آن را در سرعت نسبی بالاتر تولید محتوای سایر زبان‌ها در بازه زمانی کرونا دانست و موجب شد این عدد به زیر سه درصد نزول کند. خوشبختانه با گذار از یک نزول ناگهانی، طی نیمه اول سال ۲۰۲۱ زبان فارسی دوباره روند صعودی خود را در پیش گرفته و با کسب سهم ۳.۴ درصدی همچنان پنجمین زبان وب است.

زبان فارسی، پنجمین زبان وب است

طبق آمار منتشر شده در W۳TeCH رشد زبان فارسی نسبت به زبان‌هایی مانند زبان عربی و انگلیسی بیشتر بوده است. اما در میان زبان‌های حوزه غرب آسیا، زبان ترکی از زبان فارسی رشد بیشتری داشته است. به طوری که در سال ۲۰۱۸ زبان فارسی بالاترین رتبه را در حوزه غرب آسیا داشت؛ ولی اکنون زبان ترکی در این حوزه پیشی گرفته و به سومین زبان وب‌سایت‌های دنیا تبدیل شده است.

زبان روسی همچنان رشد خوب چند سال اخیر خود را ادامه داده و عنوان دومین زبان را پس از زبان انگلیسی دارا است. زبان روسی توانسته برتری قابل توجهی نسبت به سایر زبان‌های قدرتمند همچون آلمانی و فرانسوی به دست آورد.

البته این افزایش کمیت زبان فارسی به شرطی مقبول است و موجب رشد این زبان می‌شود که کیفیت محتوا نیز در حال افزایش باشد. طبق آمار ارائه شده در سال ۹۶، در میان چهار میلیارد صفحه فارسی شناسایی‌شده توسط جست‌وجوگر پارسی‌جو، نزدیک به ۲۵ درصد آن، ارزشمند بوده و بقیه صفحات تکراری یا اسپم بوده است که نشان از ضعف کیفیت محتوا دارد؛ ولی آمار دقیقی از وضعیت جدید کیفیت محتوا در دسترس نیست. اما برخی شاخص‌ها نظیر افزایش چشمگیر محتوای کتاب دیجیتالی فارسی نشان از رشد محتوای ارزشمند در این حوزه دارد. هرچند تناسب رشد کیفیت و کمیت محتوای فارسی نیاز به پژوهش‌های گسترده‌تر دارد.

تاثیرات فضای مجازی بر تغییر شکل خط و ساختار زبان فارسی

دو رسانه «گفتار» و «خط» رسانه‌هایی هستند که عمر زیادی دارند و از مدت‌ها قبل با انسان بوده‌اند هرچند ممکن است به‌زودی رسانه‌هایی مانند رسانه انتقال مفهوم از مغز یک انسان به مغز انسانی دیگر ظهور کنند؛ اما فعلاً همین دو رسانه در اختیار است.

فضای مجازی از این جهت که حوزه نفوذ زبانی را افزایش می‌دهد، آموزش زبان را آسان و دسترسی به محتوای علمی، فرهنگی و خبر را تسهیل کرده و محتوای فارسی را در سراسر فضای مجازی گسترش داده و کسب و کارهای جدیدی خلق می‌کند، یک فرصت است؛ اما مشکل از ‌آنجا آغاز می‌شود که محتوای ناسالم در حوزه خط،  زبان و فرهنگ در فضای مجازی منتشر شود. زیرا محتوای اصیل و ارزشمند است که موجب غنای زبان می‌گردد و کاهش کیفیت آن آسیب جدی به زبان وارد خواهد کرد.

اما در خصوص خط فارسی، فضای مجازی آسیب‌هایی از جمله شکسته‌نویسی، غلط‌نویسی و خلاصه‌نویسی بی‌ضابطه را در بر داشته است. که به ماهیت و اقتضائات فضای مجازی که افزایش سرعت در نگارش است برمی‌گردد. برای اصلاح این روند و کاهش آسیب‌های آن نیاز است راهکارهای ذیل به‌صورت هم‌زمان و با اراده کافی در دستگاه‌های سیاست‌گذار و حاکمیتی حوزه خط و زبان فارسی از جمله فرهنگستان زبان و ادب فارسی و مرکز ملی فضای مجازی پیگیری شوند.

تفکیک قالب نوشتاری مجازی و غیر مجازی

در حال حاضر گونه معیار زبان فارسی با گونه فضای مجازی آن تفاوت دارد و چنانچه گونه فضای مجازی خط و زبان فارسی به رسمیت شناخته شود و استانداردسازی گردد و هرکدام از این گونه‌ها در جای خود استفاده شوند، مشکلی ایجاد نخواهد شد. ولی چنانچه زبانور آن قدر در گونه زبانی خاص غرق شود که وقتی وارد گونه جدید شود نتواند خود را تطبیق دهد، موجب ایجاد آسیب به خط و زبان می­‌شود.

ضابطه‌مند شدن شکسته‌نویسی در فضای مجازی

با توجه به مقتضیات نگارش در فضای مجازی که از جمله آنها سرعت بالا در این فضا است. چنانچه شکسته‌نویسی‌ها توسط نهادی نظیر فرهنگستان زبان و ادب فارسی ضابطه‌مند شوند، می‌تواند به ساماندهی خط و زبان در این حوزه کمک کند. نمونه این کار در کشورهای توسعه‌یافته و بر روی زبان‌هایی نظیر انگلیسی انجام شده است.

توسعه ابزارهای پردازشی برای تسهیل کار کاربران

ابزارهای پردازشی نظیر ابزارهای ویرایش خودکار و یا ابزارهای تصحیح خودکار املایی می‌توانند تاثیر بسزایی در جلوگیری از آسیب به خط و زبان در حین نگارش کاربران در فضای مجازی داشته باشد. این ابزارها ضمن کمک به سرعت نگارش کاربر، اشتباهات سهوی کاربران را نیز تصحیح می‌کنند.

 پردازش خط و زبان فارسی

یکی از موضوعات مهم برای رشد و توسعه زبان فارسی و بسیاری از فناوری‌های دیگر نظیر کلان‌داده‌ها و اینترنت اشیاء در کشور، توسعه پردازش خط و زبان فارسی است. شناخت علایق، تفکر و پیش‌بینی الگوهای جامعه نیاز به پردازش محتوای تولید شده توسط کاربران در فضای مجازی دارد. یکی از روندهای جدی در حوزه توسعه محتوا در آینده نزدیک، بهره‌گیری از ماشین‌ها و ربات‌ها برای تولید محتوا است که این کار مستلزم  پردازش ماشینی خط و زبان است. همچنین به تازگی مهندسی افکار و نگرش‌ها از طریق دست‌کاری ماشینی کامنت‌ها و پست‌ها توسط ماشین انجام می­‌شود.

اندازه بازار محصولات پردازش زبان طبیعی در سال ۲۰۲۰ بالغ بر  ۱۰.۷ میلیارد دلار بوده است و پیش‌بینی می‌شود تا سال ۲۰۲۶ با نرخ رشد سالانه ۲۶.۸۴ درصدی به ۴۸.۴۶ میلیارد دلار برسد. علی‌رغم این بازار بزرگ جهانی، رقم این بازار در داخل کشور بسیار ناچیز است. شرکت‌های کمی در این زمینه فعال هستند و کیفیت خدمات چندان بالا نیست. در بسیاری از حوزه‌ها، بازار در تصاحب رقبای خارجی نظیر گوگل و مایکروسافت است. چالش‌های مطرح در حوزه پردازش خط و زبان فارسی در سه سطح بخش عرضه، بخش تقاضا و فناوری مطرح می‌شوند.

 چالش‌های بخش عرضه

چالش‌های شناسایی شده در این بخش عبارت‌اند از:

در حال حاضر محصولات رایگان و با کیفیت خارجی در بازار وجود دارند که مشتریان بیشتر تمایل در استفاده از آن‌ها را دارند.

موضوع مالکیت معنوی و استفاده تجاری دادگان در کشور تعیین تکلیف نشده است و اجازه‌نامه استفاده و روند استفاده نیز هنوز مشخص نیست.

 هزینه تهیه برخی از زیرساخت‌های این حوزه وابسته به نرخ ارز است و در نتیجه هزینه ریالی تمام شده محصولات به دلیل نوسانات ارز از مشکلات عرضه‌کنندگان است.

 چالش‌های بخش تقاضا

در حوزه تقاضا اعتماد به محصولات داخلی کم است و غالب مشتریان ترجیح می­دهند از محصولات آماده خارجی استفاده کنند. می‌توان گفت علت اولیه مهم در این خصوص، فقدان مرجع مشخصی برای ارزیابی و استانداردسازی محصولات، ابزارها و خدمات این حوزه است.

 چالش‌های بخش فناوری

در دسترس نبودن دادگان خصوصاً دادگان متنی و گفتاری از نوع محاوره‌ای و همچنین تامین زیرساخت‌های پردازشی سخت‌افزاری از جمله چالش‌های فناوری در این حوزه است.

سایر چالش‌ها در حوزه خط و زبان فارسی

علاوه برنکات یاد شده در حوزه محتوایی و پردازشی خط و زبان فارسی در فضای مجازی، به چالش‌های زیر نیز در این حوزه می­توان اشاره کرد که موجب شده است زبان فارسی در فضای مجازی نتواند جایگاه شایسته خود را پیدا کند.

  • عدم تمایل محققان و دانشگاهیان به انتشار نتایج تحقیقات خود به زبان فارسی در فضای مجازی
  •  کمبود نشریات معتبر علمی الکترونیکی به زبان فارسی در حوزه‌های مختلف علم و فناوری
  •  عدم ساماندهی مناسب بانک‌های اطلاعاتی علمی-پژوهشی فارسی
  •   کم توجهی به امکانات و قابلیت‌های فضای مجازی در جهت ارتقای مهارت‌های زبانی و ادبی عموم جامعه
  •   عدم بهره‌برداری مناسب از فرصت‌ها و قابلیت‌های ویژه فضای مجازی به منظور گسترش و آموزش مجازی خط و زبان فارسی به غیرفارسی زبانان و کودکان ایرانی خارج از کشور
  •   کم‌توجهی به استفاده از ظرفیت‌های بین‌المللی به‌ویژه کشورهای فارسی زبان برای اجرای طرح‌های مشترک در زمینه‌های صیانت و ترویج خط و زبان فارسی و توسعه منابع زبانی و زیر ساخت‌های پردازشی
  •   عدم وجود روال‌های رصد تحلیلی و آینده‌پژوهی در خصوص وضعیت خط و زبان فارسی در فضای مجازی

راهکارهای پیشنهادی

بهره‌مندی از فرصت‌های فضای مجازی و جلوگیری از تهدیدهای آن برای خط و زبان فارسی نیاز به عزم ملی دارد؛ لذا زمینه‌سازی برای ایجاد و تحقق نهضت ملی صیانت و ترویج خط و زبان فارسی در فضای مجازی ضرورت می‌یابد. (۱) احیای آگاهی‌های‌ عمومی و ارتقای خودباوری و غیرت ملی نسبت به جایگاه و ارزش خط و زبان فارسی در تبیین و حفظ معارف والای بشری، (۲) فعال‌سازی خواص و تأثیرگذاران دینی، فکری، علمی، فرهنگی، هنری و سیاسی در خصوص اشاعه گفتمان صیانت از خط و زبان فارسی به عنوان یک سرمایه بی‌بدیل ملی و همچنین، (۳) جریان‌سازی اجتماعی بر بسترهای گوناگون فضای مجازی برای پاسداشت خط و زبان معیار از جمله اقدامات اساسی موردنیاز برای زمینه‌سازی تحقق نهضت ملی است.

فضای مجازی از نظر فنی و کاربری، قابلیت‌ها و محدودیت‌هایی دارد که شرایط و مقتضیات خاصی را بر خط و زبان حاکم می‌کند. به منظور پاسخگویی به هنگام و مؤثر به نیازهای خط و زبان در فضای مجازی و تجهیز خط و زبان، رصد مستمر و تحلیلی و چاره‌اندیشی علمی و فنی نسبت به مسائل ضرورت دارد.

در همین راستا، نیاز به ابزارها و سامانه‌های کارآمد پشتیبانی‌کننده از کاربرد خط و زبان فارسی در فضای مجازی، مسئله مهمی است که تا به حال به نحو مؤثری به آن پرداخته نشده است و عملاً بازار این حوزه در کشور در دست پلتفرم‌های بزرگ نظیر گوگل است. از این رو، تحقق مدیریت متمرکز و هدفمند دانش و فناوری در این حوزه، توسعه دادگان و منابع زبانی و سامانه‌­های پردازشی از الزامات اساسی در شرایط حاضر است.

علاوه بر این، برای توسعه خط و زبان فارسی در فضای مجازی لازم است پیوندهای راهبردی و همکاری‌های بین‌المللی به‌ویژه با کشورهای فارسی ‌زبان بیش از پیش برقرار گردد و از ظرفیت‌های بین‌المللی در این راستا استفاده شود.

* کارشناس مرکز ملی فضای مجازی