2024-05-07@09:15:10 GMT
۲۸ نتیجه - (۰.۰۰۵ ثانیه)
جدیدترینهای «پردازش زبان فارسی»:
بیشتر بخوانید: اخبار اقتصادی روز در یوتیوب
محمدامین آقامیری دبیر شورای عالی فضای مجازی در پاسخ به خبرنگار آنا پیرامون لزوم بومیسازی مدلهای زبانی فارسی هوش مصنوعی گفت: از آنجا که تمام داشتههای کشور به زبان فارسی است باید بتوانیم آن را در تمامی ابزارهای جدید متبلور کنیم تا از زبان و فرهنگ فارسی محافظت شود، چون تمامی فناوریهای نوظهوری که ایجاد میشود به زبان انگلیسی است این موضوع نیازمند تلاش بیشتر است. وی در ادامه افزود: اگر از این فناوریها و مدلهای زبانی به درستی استفاده شود باعث شکوفایی هر چه بیشتر زبان فارسی خواهد شد. زبان فارسی غنا زیادی دارد و یکی از بخشهای هویتی کشور در تمام دورانها محسوب میشود که با توسعه مدل بزرگ زبانی میتوانیم از این داشتههای تاریخی حفاظت و استفاده...
به گزارش خبرگزاری صدا و سیما؛ همایش الزامات توسعه مدل زبانی بزرگ فارسی با عنوان «هوش مصنوعی مولد قدرت حکومتها» به همت ستاد توسعه فناوریهای هوش مصنوعی و رباتیک معاونت علمی ریاستجمهوری در پژوهشگاه ارتباطات و فناوری اطلاعات (ایرانداک) برگزار شد. در این نشست، کلان پیکره زبان فارسی با حمایت ستاد توسعه فناوریهای هوش مصنوعی و رباتیک و توسعه داده شده توسط یکی از شرکتهای فناور رونمایی شد. این کلان پیکره با آزادرسانی به صورت open source با تنوع بالا و حفظ بافتار متن در دسترس عموم قرار خواهد گرفت. مدل زبان بزرگ» یا LLM (Large language model)، یک نوع نوآوری در حوزه هوش مصنوعی است که از شبکههای عصبی با پارامترهای گسترده برای پردازش پیشرفته زبان استفاده میکند. هوش...
به گزارش خبرگزاری صداوسیما، به نقل از مرکز ارتباطات و اطلاعرسانی معاونت علمی، فناوری و اقتصاد دانش بنیان ریاست جمهوری، کلان پیکره زبان فارسی، بزرگترین مجموعه دادگان شامل ۳۵ میلیارد کلمه در همایش الزامات توسعه مدل زبانی بزرگ فارسی رونمایی شد. بر اساس این گزارش، همایش الزامات توسعه مدل زبانی بزرگ فارسی با عنوان هوش مصنوعی مولد قدرت حکومتها به همت ستاد توسعه فناوریهای هوش مصنوعی و رباتیک ۲۰اسفند، در پژوهشگاه ارتباطات و فناوری اطلاعات برگزار شد. در این نشست، کلان پیکره زبان فارسی با حمایت ستاد توسعه فناوریهای هوش مصنوعی و رباتیک و توسعه داده شده توسط یک شرکت نوآور رونمایی شد. این کلان پیکره با آزاد رسانی به صورت« open source» با تنوع بالا و حفظ بافتار...
به گزارش خبرنگار گروه پژوهش و دانش خبرگزاری علم و فناوری آنا، همایش الزامات توسعه مدل زبانی بزرگ فارسی با عنوان هوش مصنوعی مولد قدرت حکومتها توسط ستاد توسعه فناوریهای هوش مصنوعی و رباتیک یکشنبه(۲۰ اسفندماه) در پژوهشگاه ارتباطات و فناوری اطلاعات برگزار شد.در این رویداد از کلان پیکره زبان فارسی با حمایت ستاد توسعه فناوریهای هوش مصنوعی و رباتیک و توسعه داده شده از سوی شرکت ترگمان رونمایی شد. این کلان پیکره با دسترسی آزاد (open source) با تنوع بالا و حفظ بافتار متن در دسترس عموم قرار خواهد گرفت.قابل ذکر است «مدل زبان بزرگ» یا LLM (Large language model)، یک نوع نوآوری در حوزه هوش مصنوعی است که از شبکههای عصبی با پارامترهای گسترده برای پردازش پیشرفته زبان...
به گزارش خبرگزاری مهر به نقل از معاونت علمی، فناوری و اقتصاد دانشبنیان ریاست جمهوری، بهروز مینایی، دبیر ستاد توسعه فناوریهای هوش مصنوعی و رباتیک ضمن اشاره به اینکه «مدل زبان بزرگ» یا LLM (Large language model)، یک نوع نوآوری در حوزه هوش مصنوعی است که از شبکه های عصبی با پارامترهای گسترده برای پردازش پیشرفته زبان استفاده میکند؛ گفت: هوش مصنوعی به عنوان یک فناوری نوظهور در حال اثرگذاری مستقیم برروی تمام شئون زندگی بشری است. وی، هوش مصنوعی مولد را در میان انواع فناوریهای مبتنی بر هوش مصنوعی، عالیترین مظهر بروز دانست و افزود: هوش مصنوعی مولد در یک سال اخیر بیشترین پیشرفت را به خود اختصاص داده و عمده سهم این پیشرفت متکی به مدلهای زبانی بزرگ(LLM...
به گزارش خبرگزاری مهر به نقل از پژوهشگاه ارتباطات و فناوری اطلاعات، پردازش زبان طبیعی یکی از شاخههای هوش مصنوعی است که به کامپیوترها در درک و فهم زبان انسان کمک میکند. زبان طبیعی همان زبانی است که انسانها از طریق آن با یکدیگر صحبت میکنند اما کامپیوترها توان فهم و پردازش این زبان را ندارند. لذا یکی از چالشها و موضوعات اساسی عموم محصولات بومی و خدمات قابل ارائه در فضای مجازی کشور از جمله شبکههای اجتماعی، پردازش زبان فارسی به منظور درک بهتر نیازهای کاربران میباشد. در این راستا اولین رویداد ملی «تحلیل متن فارسی در شبکههای اجتماعی» در تاریخ ۱۹ مهر سال جاری در پژوهشگاه ارتباطات و فناوری اطلاعات برگزار خواهد شد. این رویداد ضمن شناسایی افراد...
به گزارش همشهری آنلاین، رضا رضازادگان مدیرعامل این شرکت میگوید: «این نرمافزار با استفاده از هوش مصنوعی میتواند نوشتههای فارسی را بهعنوان یک زبان طبیعی، به گفتار تبدیل کند. این نرمافزار با توجه به کاربردهای مختلف آن، توانسته است مورد استفاده مجموعههای مختلف آموزشی، دوبله و متن خوانی، تولید کنندگان کتاب صوتی و شرکت های دیگر قرار گیرد.» او ادامه داد: «این نرمافزار همچنین میتواند به افرادی که توانایی خوانش متون را ندارند، کمک کند؛ به گونهای که حتی نابینان هم میتوانند با استفاده از این نرم افزار، متن را به گفتار تبدیل کرده و از آن استفاده کنند.» رضازادگان گفت: «با توجه به عدم حرکتگذاری کلمات در زبان فارسی از یکسو و وجود کسره اضافه از سوی دیگر، پردازش...
به گزارش گروه ارتباطات و فناوری اطلاعات خبرگزاری علم و فناوری آنا، یکی از چالشها و موضوعات اساسی عموم محصولات و خدمات قابل ارائه در فضای مجازی کشور، پردازش زبان طبیعی و چالشهای حوزه خط و زبان فارسی است به همین منظور اولین رویداد "تحلیل متن زبان فارسی در شبکههای اجتماعی" در تاریخ ۱۹ مهر سال جاری در پژوهشگاه ارتباطات و فناوری اطلاعات برگزار خواهد شد. پژوهشگاه ارتباطات و فناوری اطلاعات قصد دارد تا با شناسایی افراد توانمند و بهرهگیری از ایدههای خلاق آنها در یک فضای رقابتی سالم به حل مسائل و چالشهای واقعی خدمات بومی کشور بپردازد. این رویداد با هدف تقویت دانش بومی در زمینه پردازش زبان طبیعی در فضای مجازی و همچنین بهبود کیفی محصولات و...
سرپرست آزمایشگاه پردازش هوشمند متن و زبان طبیعی دانشکده مهندسی برق و کامپیوتر دانشگاه تهران از ساخت خطایاب فارسی بهعنوان دستاورد آزمایشگاه پردازش متن و زبانهای طبیعی در دانشگاه تهران خبر داد. هشام فیلی در گفتوگو با ایران اکونومیست، با بیان اینکه امروزه حجم زیادی از محتوی فارسی رسمی در قالب اخبار، مقالات، پایاننامهها و نامههای اداری تولید و بهصورت الکترونیکی منتشر میشود، اظهار کرد: از این منظر صحیح و استاندارد بودن این متون اهمیت زیادی پیدا میکند. وی افزود: در این راستا پژوهشگران آزمایشگاه پردازش متن و زبانهای طبیعی دانشگاه تهران موفق شدند یک محصول کارا و دقیق جهت صیانت از خط و زبان فارسی در فضای مجازی تولید کنند. مدیرگروه نرم افزار دانشکده مهندسی برق و کامپیوتر خاطرنشان کرد: این...
پیکره بزرگ متنی فارسی با همکاری آزمایشگاه پردازش زبان طبیعی و گفتار زبان فارسی دانشگاه صنعتی شریف و یک شرکت دانشبنیان، به صورت رایگان در اختیار محققان حوزه پردازش زبان طبیعی قرار گرفت. به گزارش خبرنگار گروه علم و فناوری خبرگزاری برنا؛ گروه حرفهای از آزمایشگاه پردازش زبان طبیعی و گفتار دانشگاه صنعتی شریف به سرپرستی دکتر حسین صامتی به همراه محققان مرکز نوآوری شرکت دانشبنیان عصرگویشپرداز برای این مساله راهحل پیکره ناب را معرفی کردند. محمدرضا حسینیان مدیرعامل این مرکز نوآوری اعلام کرد: این پیکره، مجموعه پاکسازی شده و قابل استفاده مستقیم برای محققان حوزه پردازش زبان طبیعی در فارسی است. این مجموعه شامل حدود ۱۳۰ گیگابایت دیتا متنی شامل ۲۵۰ میلیون پاراگراف و ۱۵ میلیارد کلمه است. وی گفت:...
به گزارش خبرنگار مهر، محمدرضا حسینیان مدیرعامل مرکز نوآوری یک شرکت دانش بنیان با بیان اینکه «پیکره متنی بزرگ» یکی از مهمترین نیازهای آموزش مدلهای شبکه عصبی عمیق به خصوص شبکههای بر پایه ترنسفورمر است، گفت: استفاده از پیکره متنی برای زبانهای با منابع کمتر مانند فارسی بیشتر احساس میشود. وی افزود: بدین منظور تیمی از آزمایشگاه پردازش زبان طبیعی و گفتار دانشگاه صنعتی شریف به همراه محققان مرکز نوآوری یک شرکت دانشبنیان برای این مساله راهحل پیکره ناب را معرفی کردند. این پیکره، مجموعه پاکسازی شده و قابل استفاده مستقیم برای محققان حوزه پردازش زبان طبیعی در فارسی است. حسینیان با بیان اینکه این مجموعه شامل حدود ۱۳۰ گیگابایت دیتا متنی شامل ۲۵۰ میلیون پاراگراف و ۱۵ میلیارد کلمه...
پیکره متنی بزرگ از مهمترین نیازهای آموزش مدلهای شبکه عصبی عمیق به خصوص شبکههای بر پایه ترنسفورمر است. ضرورت این مسئله به خصوص برای زبانهای با منابع کمتر مثل فارسی بیشتر احساس میشود. بدین منظور گروه حرفهای از آزمایشگاه پردازش زبان طبیعی و گفتار دانشگاه صنعتی شریف به سرپرستی دکتر حسین صامتی به همراه محققان مرکز نوآوری شرکت دانشبنیان عصرگویشپرداز برای این مساله راهحل پیکره ناب را معرفی کردند. محمدرضا حسینیان مدیرعامل این مرکز نوآوری اعلام کرد: این پیکره، مجموعه پاکسازی شده و قابل استفاده مستقیم برای محققان حوزه پردازش زبان طبیعی در فارسی است. این مجموعه شامل حدود ۱۳۰ گیگابایت دیتا متنی شامل ۲۵۰ میلیون پاراگراف و ۱۵ میلیارد کلمه است. وی گفت: همچنین نسخه خام پیکره ناب...
سکوی پردازش زبان فارسی عامیانه (محاورهای)، به عنوان یکی از دستاوردهای مهم پژوهشی، توسعهای و کاربردی سامانه ذکاوت (ذائقهسنجی کاربران و تحلیل ترافیک) مورد بهره برداری قرار گرفت. همگام با طراحی و توسعه سامانه ذکاوت (ذائقهسنجی کاربران و تحلیل ترافیک)، سکوی پردازش زبان فارسی عامیانه توسعه داده شده و در این سامانه مورد بهره برداری قرار گرفت. از آنجایی که متنهای منتشرشده در پیامرسان/ شبکههای اجتماعی به صورت عامیانه بوده و پردازش زبان فارسی یکی از ارکان پایهای تحلیل محتوای متنی محسوب میشود، لذا بر اساس دانش موجود در پژوهشگاه ICT، سکوی پردازش زبان فارسی عامیانه (محاورهای) توسط پروژه « طراحی و ایجاد بستر تحلیل ترافیک و ذائقه سنجی کاربران فضای مجازی» توسعه داده شد و طی پروژه...
امیر خوراکیان درباره اهمیت توجه به تولید محتوای باکیفیت به زبان فارسی در وب گفت: میان چهار میلیارد صفحه فارسی شناساییشده توسط جستوجوگر پارسیجو، نزدیک به 25 درصد آن، ارزشمند بوده و بقیه صفحات تکراری یا اسپم است و این موضوع نشان میدهد کیفیت تولید محتوا به زبان فارسی در فضای مجازی در حد مطلوب نیست. 50 درصد وب در دست زبان انگلیسیوی با بیان اینکه سهم زبان انگلیسی در وب بیش از هر زبان دیگری است، تاکید کرد: زبان انگلیسی به تنهایی 51.2 درصد از محتوای وب را در اختیار دارد ولی این سهم در سال 2011، 57 درصد بوده و این کاهش نشاندهنده این است که کشورها برای گسترش زبان خود در فضای مجازی در تلاش هستند. معاون...
به گزارش حوزه دنیای ارتباطات گروه فضای مجازی باشگاه خبرنگاران جوان، امیر خوراکیان معاون محتوایی مرکز ملی فضای مجازی کشور با بیان اینکه در سال ۲۰۱۷، زبان فارسی به یازدهمین زبان پرکاربرد در وب رسیده، گفت: این رشد در حالی است که زبان فارسی در حال حاضر یک رتبه بالاتر از زبان ترکی و پنج رتبه بالاتر از زبان عربی قرار دارد و محبوبترین زبان منطقه غرب آسیا و خاورمیانه در شبکه جهانی وب محسوب میشود. امیر خوراکیان درباره اهمیت توجه به تولید محتوای باکیفیت به زبان فارسی در وب اظهار کرد: در میان چهار میلیارد صفحه فارسی شناساییشده توسط جستوجوگر پارسیجو، نزدیک به ۲۵ درصد آن، ارزشمند بوده و بقیه صفحات تکراری یا اسپم است و این موضوع نشان...
ایتنا -در میان چهار میلیارد صفحه فارسی شناساییشده توسط جستوجوگر پارسیجو، نزدیک به ۲۵ درصد آن، ارزشمند بوده و بقیه صفحات تکراری یا اسپم است. معاون محتوای مرکز ملی فضای مجازی کشور با بیان اینکه در سال ۲۰۱۷، زبان فارسی به یازدهمین زبان پرکاربرد در وب رسیده، گفت: این رشد در حالی است که زبان فارسی در حال حاضر یک رتبه بالاتر از زبان ترکی و پنج رتبه بالاتر از زبان عربی قرار دارد و محبوبترین زبان منطقه غرب آسیا و خاورمیانه در شبکه جهانی وب محسوب میشود. به گزارش ایتنا از ایسنا، امیر خوراکیان درباره اهمیت توجه به تولید محتوای باکیفیت به زبان فارسی در وب اظهار کرد: در میان چهار میلیارد صفحه فارسی شناساییشده توسط جستوجوگر...
رئیس پژوهشکده فناوری اطلاعات مرکز تحقیقات مخابرات ایران گفت: ۳۰ پروژه به پردازش زبان فارسی در فضای مجازی اختصاص یافت. به گزارش خبرگزاری مهر، علیرضا یاری از آزادسازی خروجی دادگان و ابزارهای پردازش خط و زبان فارسی در فضای مجازی خبر داد و گفت: رشد فناوری اطلاعات و گسترش اینترنت، مرزهای تاثیرگذاری خط و زبان را از مرزهای جغرافیایی فراتر برده و پردازش زبان به عنوان یک نیاز ملی/ بین المللی جهت استفاده بهینه از منابع اطلاعاتی مطرح شده است. رئیس پژوهشکده فناوری اطلاعات مرکز تحقیقات مخابرات ایران با بیان اینکه کاربردهای مبتنی بر پردازش زبان طبیعی مانند ترجمه ماشینی و جویشگرها اهمیت زیادی پیدا کرده و کشورهای مختلف سرمایه گذاری زیادی در این حوزه داشته اند، از اهمیت...
مبدع نخستین نرمافزار تایپ گفتاری گفت: نخستین نرمافزار تایپ گفتاری زبان فارسی براساس فناوری تشخیص گفتار پیوسته مستقل از گوینده فارسی طراحی شد که ارتباط بین انسان و ماشین (ازجمله رایانهها) را ممکن میسازد و نیاز به وجود تایپیست را از بین میبرد. به گزارش گروه اجتماعی باشگاه خبرنگاران پویا؛ از طریق فناوری نرمافزار تایپ گفتاری زبان فارسی، انسان برای انجام کارهای معمول با ماشینها میتواند بهجای استفاده از کلید و دکمه، با صحبت کردن با ماشین درخواست خود را به آن منتقل کند.حسین صامتی؛ عضو هیئت علمی دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف و طراح این نرمافزار با اشاره به اینکه فعالیت در زمینه هوش مصنوعی و پردازش سیگنال گفتار با هدف ایجاد ارتباط بین انسان و ماشین اجرایی...
به گزارش پایگاه خبری علت به نقل از پژوهشگاه ارتباطات و فناوری اطلاعات، نشست چهل و دوم شورای راهبری جویشگر بومی با حضور اعضای این شورا در محل پژوهشگاه ارتباطات...