SysNucleus WebHarvy 7.8.0.244
اداة مكشطة ( استنساخ ) ويب و استخراج البيانات من صفحات
اسم البرنامج : SysNucleus WebHarvy 7.8.0.244
باستخدام WebHarvy، يمكنك بسهولة استخراج النصوص وHTML
والصور وعناوين URL ورسائل البريد الإلكتروني من أي موقع ويب،
وحفظ البيانات المستخرجة بتنسيقات مختلفة.
اللغات: الإنجليزية | حجم الملف: ١٣٧ ميجابايت
ميزات WebHarvy
- سهل الاستخدام للغاية: يستطيع WebHarvy استخراج البيانات من أي موقع ويب، وإدارة تسجيل الدخول، وإرسال النماذج، والتنقل، وتقسيم الصفحات، والفئات، والكلمات المفتاحية. يدعم الوكلاء والاستخراج المجدول.
- كشط الويب بسهولة: أصبح استخراج البيانات من الويب غاية في السهولة مع واجهة WebHarvy التي تعمل بنظام النقر والنقر. لا يتطلب استخراج البيانات أي برمجة أو نصوص برمجية. باستخدام متصفح WebHarvy المدمج، يمكنك تحميل مواقع الويب، وتصفح صفحاتها، ثم النقر ببساطة لاختيار البيانات التي تريد استخراجها.
- اكتشاف الأنماط الذكية: يتعرف WebHarvy بذكاء على أنماط البيانات الواردة في صفحات الويب. لاستخراج قائمة أو جدول عناصر (الاسم، العنوان، البريد الإلكتروني، السعر، إلخ) من صفحة ويب، لا حاجة لأي خطوات إضافية. في حال تكرار البيانات، يقوم WebHarvy باستخراجها تلقائيًا.
- حفظ في ملف أو قاعدة بيانات: يمكن حفظ البيانات المُستخرجة بتنسيقات متعددة. يتيح لك أحدث إصدار من WebHarvy تصدير البيانات كملفات Excel أو XML أو CSV أو JSON أو TSV. بالإضافة إلى ذلك، يمكنك تصدير البيانات مباشرةً إلى قاعدة بيانات SQL (مثل MySQL أو SQL Server أو Oracle، إلخ).
- التعامل مع الترقيم (التنقل بين الصفحات): يستطيع WebHarvy جمع البيانات بسهولة من صفحات متعددة، مثل قوائم المنتجات أو نتائج البحث. ويدعم أساليب ترقيم صفحات متنوعة، بما في ذلك التمرير اللانهائي، وتحميل المزيد من الأزرار، وروابط أرقام الصفحات، وقوائم عناوين URL، وغيرها.
- إرسال الكلمات الرئيسية: استخرج البيانات عن طريق إرسال قائمة كلمات مفتاحية تلقائيًا في نماذج البحث. يمكنك إرسال عدد غير محدود من الكلمات المفتاحية إلى حقول إدخال نصية متعددة، مع استخراج البيانات من نتائج البحث لجميع تركيبات الكلمات المفتاحية.
- حماية الخصوصية: لجمع البيانات بشكل مجهول وتجنب حظرها من قِبل خوادم الويب، يُتيح لك WebHarvy استخدام خوادم بروكسي أو شبكة افتراضية خاصة (VPN). يمكنك اختيار الوصول إلى المواقع المستهدفة عبر خادم بروكسي واحد أو قائمة خوادم بروكسي مُتناوبة.
- كشط الفئة: يُمكّنك WebHarvy من جمع البيانات من قائمة روابط تؤدي إلى صفحات أو قوائم مشابهة على موقع إلكتروني. تتيح لك هذه الميزة جمع الفئات والفئات الفرعية داخل موقع إلكتروني باستخدام إعداد واحد.
- التعبيرات العادية: يمكن تطبيق التعبيرات العادية (RegEx) على النصوص أو مصادر HTML في صفحات الويب لجمع البيانات المتطابقة. توفر لك هذه التقنية الفعّالة مرونةً وتحكمًا أكبر في اختيار البيانات.
- دعم جافا سكريبت: شغّل شفرة جافا سكريبت مخصصة في المتصفح قبل جمع البيانات. تتيح لك هذه الميزة التفاعل مع عناصر الصفحة، وتعديل نموذج الكائن (DOM)، أو تشغيل دوال جافا سكريبت المُطبّقة مسبقًا على الصفحة.
- كشط الصور: يمكن تنزيل الصور أو استخراج روابطها. يستطيع WebHarvy استخراج صور متعددة تلقائيًا من صفحات تفاصيل المنتجات على مواقع التجارة الإلكترونية.
- أتمتة مهام المتصفح: يمكن تكوين WebHarvy بسهولة لأداء مهام مثل النقر فوق الروابط، وتحديد خيارات القائمة/القائمة المنسدلة، وإدخال نص إلى حقل، وتمرير الصفحة، وفتح النوافذ المنبثقة وما إلى ذلك.
WebHarvy Web Scraper Overview and Features
Key Features:
- Easy to Use: Visual point-and-click interface
- Pattern Recognition: Automatically detects repeating data patterns
- Multiple Export Formats: Excel, XML, CSV, JSON, TSV, and direct to SQL databases
- Pagination Support: Handles multiple pages, infinite scroll, "Load More" buttons
- Keyword Submission: Automatically submits search queries and extracts results
- Proxy/VPN Support: For anonymous data collection
- Category Scraping: Extracts data from category links and subcategories
- Regular Expressions: Advanced pattern matching
- JavaScript Support: Execute custom scripts before scraping
- Image Scraping: Download images or extract image URLs
- Browser Automation: Click links, select dropdowns, enter text, handle popups
Technical Details:
- Languages: English
- File Size: 137 MB
- Website: https://www.webharvy.com/