آخرین اخبار «پردازش زبان فارسی»

جدیدترین‌های «پردازش زبان فارسی»:

بیشتر بخوانید: اخبار اقتصادی روز در یوتیوب

حفاظت از هویت ایرانی با توسعه مدل بزرگ زبانی فارسی

محمدامین آقامیری دبیر شورای عالی فضای مجازی در پاسخ به خبرنگار آنا پیرامون لزوم بومی‌سازی مدل‌های زبانی فارسی هوش مصنوعی گفت: از آنجا که تمام داشته‌های کشور به زبان فارسی است باید بتوانیم آن را در تمامی ابزار‌های جدید متبلور کنیم تا از زبان و فرهنگ فارسی محافظت شود، چون تمامی فناوری‌های نوظهوری که ایجاد می‌شود به زبان انگلیسی است این موضوع نیازمند تلاش بیشتر است. وی در ادامه افزود: اگر از این فناوری‌ها و مدل‌های زبانی به درستی استفاده شود باعث شکوفایی هر چه بیشتر زبان فارسی خواهد شد. زبان فارسی غنا زیادی دارد و یکی از بخش‌های هویتی کشور در تمام دوران‌ها محسوب می‌شود که با توسعه مدل بزرگ زبانی می‌توانیم از این داشته‌های تاریخی حفاظت و استفاده...

رونمایی از کلان پیکره زبان فارسی با ۳۵ میلیارد کلمه

به گزارش خبرگزاری صدا و سیما؛ همایش الزامات توسعه مدل زبانی بزرگ فارسی با عنوان «هوش مصنوعی مولد قدرت حکومت‌ها» به همت ستاد توسعه فناوری‌های هوش مصنوعی و رباتیک معاونت علمی ریاست‌جمهوری در پژوهشگاه ارتباطات و فناوری اطلاعات (ایرانداک) برگزار شد. در این نشست، کلان پیکره زبان فارسی با حمایت ستاد توسعه فناوری‌های هوش مصنوعی و رباتیک و توسعه داده شده توسط یکی از شرکت‌های فناور رونمایی شد. این کلان پیکره با آزادرسانی به صورت open source با تنوع بالا و حفظ بافتار متن در دسترس عموم قرار خواهد گرفت. مدل زبان بزرگ» یا LLM (Large language model)، یک نوع نوآوری در حوزه هوش مصنوعی است که از شبکه‌های عصبی با پارامترهای گسترده برای پردازش پیشرفته زبان استفاده می‌کند. هوش...

کلان پیکره زبان فارسی با ۳۵ میلیارد کلمه، نوآوری از ایرانیان

به گزارش خبرگزاری صداوسیما، به نقل از مرکز ارتباطات و اطلاع‌رسانی معاونت علمی، فناوری و اقتصاد دانش بنیان ریاست جمهوری، کلان پیکره زبان فارسی، بزرگترین مجموعه دادگان شامل ۳۵ میلیارد کلمه در همایش الزامات توسعه مدل زبانی بزرگ فارسی رونمایی شد. بر اساس این گزارش، همایش الزامات توسعه مدل زبانی بزرگ فارسی با عنوان هوش مصنوعی مولد قدرت حکومت‌ها به همت ستاد توسعه فناوری‌های هوش مصنوعی و رباتیک ۲۰اسفند، در پژوهشگاه ارتباطات و فناوری اطلاعات برگزار شد. در این نشست، کلان پیکره زبان فارسی با حمایت ستاد توسعه فناوری‌های هوش مصنوعی و رباتیک و توسعه داده شده توسط یک شرکت نوآور رونمایی شد. این کلان پیکره با آزاد رسانی به صورت« open source» با تنوع بالا و حفظ بافتار...

همایش الزامات توسعه مدل زبانی بزرگ فارسی برگزار شد

به گزارش خبرنگار گروه پژوهش و دانش خبرگزاری علم و فناوری آنا، همایش الزامات توسعه مدل زبانی بزرگ فارسی با عنوان هوش مصنوعی مولد قدرت حکومت‌ها توسط ستاد توسعه فناوری‌های هوش مصنوعی و رباتیک یکشنبه(۲۰ اسفندماه) در پژوهشگاه ارتباطات و فناوری اطلاعات برگزار شد.در این رویداد از کلان پیکره زبان فارسی با حمایت ستاد توسعه فناوری‌های هوش مصنوعی و رباتیک و توسعه داده شده از سوی شرکت ترگمان رونمایی شد. این کلان پیکره با دسترسی آزاد (open source) با تنوع بالا و حفظ بافتار متن در دسترس عموم قرار خواهد گرفت.قابل ذکر است «مدل زبان بزرگ» یا LLM (Large language model)، یک نوع نوآوری در حوزه هوش مصنوعی است که از شبکه‌های عصبی با پارامتر‌های گسترده برای پردازش پیشرفته زبان...

همایش «الزامات توسعه مدل زبانی بزرگ فارسی» برگزار می شود

به گزارش خبرگزاری مهر به نقل از معاونت علمی، فناوری و اقتصاد دانش‌بنیان ریاست جمهوری، بهروز مینایی، دبیر ستاد توسعه فناوری‌های هوش مصنوعی و رباتیک ضمن اشاره به اینکه «مدل زبان بزرگ» یا LLM (Large language model)، یک نوع نوآوری در حوزه هوش مصنوعی است که از شبکه های عصبی با پارامترهای گسترده برای پردازش پیشرفته زبان استفاده می‌کند؛ گفت: هوش مصنوعی به عنوان یک فناوری نوظهور در حال اثرگذاری مستقیم برروی تمام شئون زندگی بشری است. وی، هوش مصنوعی مولد را در میان انواع فناوری‌های مبتنی بر هوش مصنوعی، عالی‌ترین مظهر بروز دانست و افزود: هوش مصنوعی مولد در یک سال اخیر بیشترین پیشرفت را به خود اختصاص داده و عمده سهم این پیشرفت متکی به مدل‌های زبانی بزرگ(LLM...

رویداد ملی «تحلیل متن فارسی در شبکه‌های اجتماعی»برگزار می شود

به گزارش خبرگزاری مهر به نقل از پژوهشگاه ارتباطات و فناوری اطلاعات، پردازش زبان طبیعی یکی از شاخه‌های هوش مصنوعی است که به کامپیوترها در درک و فهم زبان انسان کمک می‌کند. زبان طبیعی همان زبانی است که انسان‌ها از طریق آن با یکدیگر صحبت می‌کنند اما کامپیوترها توان فهم و پردازش این زبان را ندارند. لذا یکی از چالش‌ها و موضوعات اساسی عموم محصولات بومی و خدمات قابل ارائه در فضای مجازی کشور از جمله شبکه‌های اجتماعی، پردازش زبان فارسی به منظور درک بهتر نیازهای کاربران می‌باشد. در این راستا اولین رویداد ملی «تحلیل متن فارسی در شبکه‌های اجتماعی» در تاریخ ۱۹ مهر سال جاری در پژوهشگاه ارتباطات و فناوری اطلاعات برگزار خواهد شد. این رویداد ضمن شناسایی افراد...

تولید نرم افزار تبدیل متن به گفتار فارسی | چت بات هوشمند به‌زودی عرضه می‌شود

به گزارش همشهری آنلاین، رضا رضازادگان مدیرعامل این شرکت می‌گوید: «این نرم‌افزار با استفاده از هوش مصنوعی می‌تواند نوشته‌های فارسی را به‌عنوان یک زبان طبیعی، به گفتار تبدیل کند. این نرم‌افزار با توجه به کاربردهای مختلف آن، توانسته است مورد استفاده مجموعه‌های مختلف آموزشی، دوبله و متن خوانی، تولید کنندگان کتاب صوتی و شرکت های دیگر قرار گیرد.» او ادامه داد: «این نرم‌افزار همچنین می‌تواند به افرادی که توانایی خوانش متون را ندارند، کمک کند؛ به گونه‌ای که حتی نابینان هم می‌توانند با استفاده از این نرم افزار، متن را به گفتار تبدیل کرده و از آن استفاده کنند.» رضازادگان گفت: «با توجه به عدم حرکت‌گذاری کلمات در زبان فارسی از یکسو و وجود کسره اضافه از سوی دیگر، پردازش...

رویداد تحلیل متن زبان فارسی در شبکه‌های اجتماعی برگزار می‌شود

به گزارش گروه ارتباطات و فناوری اطلاعات خبرگزاری علم و فناوری آنا، یکی از چالش‌ها و موضوعات اساسی عموم محصولات و خدمات قابل ارائه در فضای مجازی کشور، پردازش زبان طبیعی و چالش‌های حوزه خط و زبان فارسی است به همین منظور اولین رویداد "تحلیل متن زبان فارسی در شبکه‌های اجتماعی" در تاریخ ۱۹ مهر سال جاری در پژوهشگاه ارتباطات و فناوری اطلاعات برگزار خواهد شد. پژوهشگاه ارتباطات و فناوری اطلاعات قصد دارد تا با شناسایی افراد توانمند و بهره‌گیری از ایده‌های خلاق آن‌ها در یک فضای رقابتی سالم به حل مسائل و چالش‌های واقعی خدمات بومی کشور بپردازد. این رویداد با هدف تقویت دانش بومی در زمینه پردازش زبان طبیعی در فضای مجازی و همچنین بهبود کیفی محصولات و...

ساخت خطایاب فارسی در آزمایشگاه پردازش متن دانشگاه تهران

سرپرست آزمایشگاه پردازش هوشمند متن و زبان طبیعی دانشکده مهندسی برق و کامپیوتر دانشگاه تهران از ساخت خطایاب فارسی به‌عنوان دستاورد آزمایشگاه پردازش متن و زبان‌های طبیعی در دانشگاه تهران خبر داد. هشام فیلی در گفت‌وگو با ایران اکونومیست، با بیان این‌که امروزه حجم زیادی از محتوی فارسی رسمی در قالب اخبار، مقالات، پایان‌نامه‌ها و نامه‌های اداری تولید و به‌صورت الکترونیکی منتشر می‌شود، اظهار کرد: از این منظر صحیح و استاندارد بودن این متون اهمیت زیادی پیدا می‌کند. وی افزود: در این راستا پژوهشگران آزمایشگاه پردازش متن و زبان‌های طبیعی دانشگاه تهران موفق شدند یک محصول کارا و دقیق جهت صیانت از خط و زبان فارسی در فضای مجازی تولید کنند. مدیرگروه نرم افزار دانشکده مهندسی برق و کامپیوتر خاطرنشان کرد: این...

با تلاش محققین دانشگاه شریف؛ پیکره بزرگ متنی فارسی در اختیار محققان قرار گرفت

پیکره بزرگ متنی فارسی با همکاری آزمایشگاه پردازش زبان طبیعی و گفتار زبان فارسی دانشگاه صنعتی شریف و یک شرکت دانش‌بنیان، به صورت رایگان در اختیار محققان حوزه پردازش زبان طبیعی قرار گرفت. به گزارش خبرنگار گروه علم و فناوری خبرگزاری برنا؛ گروه حرفه‌ای از آزمایشگاه پردازش زبان طبیعی و گفتار دانشگاه صنعتی شریف به سرپرستی دکتر حسین صامتی به همراه محققان مرکز نوآوری شرکت دانش‌بنیان عصرگویش‌پرداز برای این مساله راه‌حل پیکره ناب را معرفی کردند. محمدرضا حسینیان مدیرعامل این مرکز نوآوری اعلام کرد: این پیکره، مجموعه پاک‌سازی شده و قابل استفاده مستقیم برای محققان حوزه پردازش زبان طبیعی در فارسی است. این مجموعه شامل حدود ۱۳۰ گیگابایت دیتا متنی شامل ۲۵۰ میلیون پاراگراف و ۱۵ میلیارد کلمه است. وی گفت:...

پیکره بزرگ متنی حوزه پردازش زبان طبیعی در فارسی تهیه شد

به گزارش خبرنگار مهر، محمدرضا حسینیان مدیرعامل مرکز نوآوری یک شرکت دانش بنیان با بیان اینکه «پیکره‌ متنی بزرگ» یکی از مهم‌ترین نیازهای آموزش مدل‌های شبکه عصبی عمیق به خصوص شبکه‌های بر پایه ترنسفورمر است، گفت: استفاده از پیکره متنی برای زبان‌های با منابع کمتر مانند فارسی بیشتر احساس می‌شود. وی افزود: بدین منظور تیمی از آزمایشگاه پردازش زبان طبیعی و گفتار دانشگاه صنعتی شریف به همراه محققان مرکز نوآوری یک شرکت دانش‌بنیان برای این مساله راه‌حل پیکره ناب را معرفی کردند. این پیکره، مجموعه پاک‌سازی شده و قابل استفاده مستقیم برای محققان حوزه پردازش زبان طبیعی در فارسی است. حسینیان با بیان اینکه این مجموعه شامل حدود ۱۳۰ گیگابایت دیتا متنی شامل ۲۵۰ میلیون پاراگراف و ۱۵ میلیارد کلمه...

پیکره بزرگ فارسی در اختیار محققان حوزه پردازش زبان طبیعی قرار گرفت

پیکره‌ متنی بزرگ از مهم‌ترین نیازهای آموزش مدل‌های شبکه عصبی عمیق به خصوص شبکه‌های بر پایه ترنسفورمر است. ضرورت این مسئله به خصوص برای زبان‌های با منابع کمتر مثل فارسی بیشتر احساس می‌شود. بدین منظور گروه حرفه‌ای از آزمایشگاه پردازش زبان طبیعی و گفتار دانشگاه صنعتی شریف به سرپرستی دکتر حسین صامتی به همراه محققان مرکز نوآوری شرکت دانش‌بنیان عصرگویش‌پرداز برای این مساله راه‌حل پیکره ناب را معرفی کردند. محمدرضا حسینیان مدیرعامل این مرکز نوآوری اعلام کرد: این پیکره، مجموعه پاک‌سازی شده و قابل استفاده مستقیم برای محققان حوزه پردازش زبان طبیعی در فارسی است. این مجموعه شامل حدود ۱۳۰ گیگابایت دیتا متنی شامل ۲۵۰ میلیون پاراگراف و ۱۵ میلیارد کلمه است. وی گفت: همچنین نسخه خام پیکره ناب...

سکوی پردازش زبان فارسی عامیانه بهره برداری شد

سکوی پردازش زبان فارسی عامیانه (محاوره‌ای)، به عنوان یکی از دستاوردهای مهم پژوهشی، توسعه‌ای و کاربردی سامانه ذکاوت (ذائقه‌سنجی کاربران و تحلیل ترافیک) مورد بهره ‎برداری قرار گرفت. همگام با طراحی و توسعه سامانه ذکاوت (ذائقه‌سنجی کاربران و تحلیل ترافیک)، سکوی پردازش زبان فارسی عامیانه توسعه داده شده و در این سامانه مورد بهره برداری قرار گرفت. از آن‌جایی که متن‌های منتشرشده در پیام‌رسان/ شبکه‌های اجتماعی به صورت عامیانه بوده و پردازش زبان فارسی یکی از ارکان پایه‌ای تحلیل محتوای متنی محسوب می‌شود، لذا بر اساس دانش موجود در پژوهشگاه ICT، سکوی پردازش زبان فارسی عامیانه (محاوره‌ای) توسط پروژه « طراحی و ایجاد بستر تحلیل ترافیک و ذائقه سنجی کاربران فضای مجازی» توسعه داده شد و طی پروژه...

فارسی؛ محبوب‌ترین زبان خاورمیانه در وب

امیر خوراکیان درباره اهمیت توجه به تولید محتوای باکیفیت به زبان فارسی در وب گفت: میان چهار میلیارد صفحه فارسی شناسایی‌شده توسط جست‌وجوگر پارسی‌جو، نزدیک به 25 درصد آن، ارزشمند بوده و بقیه صفحات تکراری یا اسپم است و این موضوع نشان می‌دهد کیفیت تولید محتوا به زبان فارسی در فضای مجازی در حد مطلوب نیست. 50 درصد وب در دست زبان انگلیسیوی با بیان این‌که سهم زبان انگلیسی در وب بیش از هر زبان دیگری است، تاکید کرد: زبان انگلیسی به تنهایی 51.2 درصد از محتوای وب را در اختیار دارد ولی این سهم در سال 2011، 57 درصد بوده و این کاهش نشان‌دهنده این است که کشورها برای گسترش زبان خود در فضای مجازی در تلاش هستند. معاون...

محبوب‌ترین زبان خاورمیانه در وب زبان فارسی است

به گزارش حوزه دنیای ارتباطات گروه فضای مجازی باشگاه خبرنگاران جوان، امیر خوراکیان معاون محتوایی مرکز ملی فضای مجازی کشور با بیان این‌که در سال ۲۰۱۷، زبان فارسی به یازدهمین زبان پرکاربرد در وب رسیده، گفت: این رشد در حالی است که زبان فارسی در حال حاضر یک رتبه بالاتر از زبان ترکی و پنج رتبه بالاتر از زبان عربی قرار دارد و محبوب‌ترین زبان منطقه غرب آسیا و خاورمیانه در شبکه جهانی وب محسوب می‌شود. امیر خوراکیان درباره اهمیت توجه به تولید محتوای باکیفیت به زبان فارسی در وب اظهار کرد: در میان چهار میلیارد صفحه فارسی شناسایی‌شده توسط جست‌وجوگر پارسی‌جو، نزدیک به ۲۵ درصد آن، ارزشمند بوده و بقیه صفحات تکراری یا اسپم است و این موضوع نشان...

زبان فارسی محبوب‌تر از زبان عربی

ایتنا -در میان چهار میلیارد صفحه فارسی شناسایی‌شده توسط جست‌وجوگر پارسی‌جو، نزدیک به ۲۵ درصد آن، ارزشمند بوده و بقیه صفحات تکراری یا اسپم است. معاون محتوای مرکز ملی فضای مجازی کشور با بیان این‌که در سال ۲۰۱۷، زبان فارسی به یازدهمین زبان پرکاربرد در وب رسیده، گفت: این رشد در حالی است که زبان فارسی در حال حاضر یک رتبه بالاتر از زبان ترکی و پنج رتبه بالاتر از زبان عربی قرار دارد و محبوب‌ترین زبان منطقه غرب آسیا و خاورمیانه در شبکه جهانی وب محسوب می‌شود. به گزارش ایتنا از ایسنا، امیر خوراکیان درباره اهمیت توجه به تولید محتوای باکیفیت به زبان فارسی در وب اظهار کرد: در میان چهار میلیارد صفحه فارسی شناسایی‌شده توسط جست‌وجوگر...

۳۰ پروژه به پردازش زبان فارسی در فضای مجازی اختصاص یافت

رئیس پژوهشکده فناوری اطلاعات مرکز تحقیقات مخابرات ایران گفت: ۳۰ پروژه به پردازش زبان فارسی در فضای مجازی اختصاص یافت. به گزارش خبرگزاری مهر، علیرضا یاری از آزادسازی خروجی دادگان و ابزارهای پردازش خط و زبان فارسی در فضای مجازی خبر داد و گفت: رشد فناوری اطلاعات و گسترش اینترنت، مرزهای تاثیرگذاری خط و زبان را از مرزهای جغرافیایی فراتر برده و پردازش زبان به عنوان یک نیاز ملی/ بین المللی جهت استفاده بهینه از منابع اطلاعاتی مطرح شده است. رئیس پژوهشکده فناوری اطلاعات مرکز تحقیقات مخابرات ایران با بیان اینکه کاربردهای مبتنی بر پردازش زبان طبیعی مانند ترجمه ماشینی و جویشگرها اهمیت زیادی پیدا کرده و کشورهای مختلف سرمایه گذاری زیادی در این حوزه داشته اند، از اهمیت...

پردازش سیگنال گفتار با هوش مصنوعی ممکن شد

مبدع نخستین نرم‌افزار تایپ گفتاری گفت: نخستین نرم‌افزار تایپ گفتاری زبان فارسی براساس فناوری تشخیص گفتار پیوسته مستقل از گوینده فارسی طراحی شد که ارتباط بین انسان و ماشین (ازجمله رایانه‌ها) را ممکن می‌سازد و نیاز به وجود تایپیست را از بین می‌برد. به گزارش گروه اجتماعی باشگاه خبرنگاران پویا؛ از طریق فناوری نرم‌افزار تایپ گفتاری زبان فارسی، انسان برای انجام کارهای معمول با ماشینها می‌تواند به‌جای استفاده از کلید و دکمه، با صحبت کردن با ماشین درخواست خود را به آن منتقل کند.حسین صامتی؛ عضو هیئت علمی دانشکده‌ مهندسی کامپیوتر دانشگاه صنعتی شریف و طراح این نرم‌افزار با اشاره به اینکه فعالیت در زمینه هوش مصنوعی و پردازش سیگنال گفتار با هدف ایجاد ارتباط بین انسان و ماشین اجرایی...

نقشه راه پردازش خط و زبان فارسی در جویشگر بومی ارائه شد

به گزارش پایگاه خبری علت به نقل از پژوهشگاه ارتباطات و فناوری اطلاعات، نشست چهل و دوم شورای راهبری جویشگر بومی با حضور اعضای این شورا در محل پژوهشگاه ارتباطات...

از نگاه رسانه‌ها

پربیننـده‌ترین‌هـا

از سراسر وب

اخبار استان‌ها

آخرین خبرها

جدیدترین‌های «پردازش زبان فارسی»:

از نگاه رسانه‌ها

پربیننـده‌ترین‌هـا

از سراسر وب

اخبار استان‌ها

آخرین خبرها