در این پست منبعی آزاد از آثار پارسی را به شما معرفی میکنم که به علاوه با ابتکار سازنده آن آقای حمیدرضا محمدی دیگران نیز به سادگی میتوانند به شکلهای مختلف به توسعه آن کمک کنند.
نام این منبع «گنجور» است و آثار بیش از ۴۳ نفر از سخنسرایان پارسیگو که مشتمل بر بیش از ۴۵۰۰۰۰ بیت است را شامل میشود، این مجموعه به صورت آنلاین در «اینجا» در دسترس است و برای استفاده به صورت آفلاین نیز نرمافزاری تحت سیستم عامل ویندوز توسط ایشون آماده شده است با نام «گنجور رومیزی» که آخرین ورژن آن فعلا ۲.۱ است که برای نصب آن باید آخرین نصاب کامل (همراه با پایگاهداده) را از «اینجا» دانلود و نصب کنید و سپس فایل بروزرسانی به ورژن ۲.۱ را از «اینجا» دانلود و نصب کنید.
اما امکان مهمتری که مقصود این پست بوده است راههای جالبیست که برای کمک به توسعه این منبع آزاد و رایگان برای کاربران مهیا شده است.
آ- بازبینی OCRها:
همانطور که میدانید تبدیل عکس به متن که با استفاده از نرمافزارهای OCR انجام میگیرد بدون خطا نخواهد بود! حال فرض کنید کتابی مشتمل بر ۱۰۰۰۰ بیت SCAN و OCR شده است، بدیهی است که بازبینی و بررسی ۱۰۰۰۰ بیت از عهده یک یا چند نفر ( آن هم به عنوان کاری داوطلبانه و بدونچشمداشت ) خارج است، در اینجاست که اینترنت و جمع کاربران علاقهمند به زبان پارسی میتوانند بهخوبی در این کار مشارکت کنند، با ابتکار جالب آقای محمدی شما میتوانید بدون خستگی و اتفاقا با لذت در «اینجا» به بازبینی خروجیهای OCR بپردازید. البته قابل ذکر است ۱۰۰۰۰ فقط برای مثال ذکر شد درواقع عدد واقعی معمولا بیش از ۵۰۰۰۰ است.
راهنمای مفصلتر بههمراه عکس
ب-اضافه کردن مجموعه شعر جدید:
با دانلود و نصب «گنجور رومیزی» و رفتن به حالت ویرایشگر میتوانید شعر و یا شاعر و یا بخش جدید اضافه کنید و سپس از منوی بخش یا شاعر و انتخاب «تولید خروجی از محتوای بخش» یا «تولید خروجی از آثار شاعر» میتوانید از محتوای اضافه خروجی مناسبی ایجاد کنید که با فرستادن به سایت گنجور به مجموعه آنلاین و ورژنهای آتی گنجور رومیزی اضافه میشود.
راهنمای مفصلتر بههمراه عکس
امیدوارم شما نیز به توسعه این مجموعه کمک کنید.