Gmail يحصل على أكبر ترقية لتصفية البريد العشوائي منذ سنوات

Báo Thanh niênBáo Thanh niên06/12/2023

[إعلان 1]

نشرت شركة جوجل مؤخرًا منشورًا على مدونتها الأمنية يوضح بالتفصيل مرشح البريد العشوائي في Gmail، والذي تصفه الشركة بأنه أحد أكبر ترقيات الدفاع لديها في السنوات الأخيرة. هذا هو نظام تصنيف نصي جديد يسمى مولد متجه النص المرن والفعال (RETVec). وتقول جوجل إن هذا يمكن أن يساعد في فهم أهمية وخصوصية النص، وهي رسائل البريد الإلكتروني المليئة بالأحرف الخاصة والرموز التعبيرية والأخطاء الإملائية والرسائل غير المرغوب فيها التي كانت في السابق قابلة للقراءة من قبل البشر ولكن لا يمكن للآلات فهمها بسهولة. في السابق، كانت رسائل البريد العشوائي المليئة بالأحرف الخاصة قادرة على تجاوز دفاعات Gmail بسهولة.

في حين أن أي مرشح للرسائل غير المرغوب فيها يمكنه التخلص من رسالة بريد إلكتروني تقول، "تهانينا! تمت إضافة رصيد بقيمة 1000 دولار إلى حساب الجائزة الكبرى الخاص بك"، فإن الغالبية العظمى من الحروف في البريد الإلكتروني تذهب إلى أعماق لا نهاية لها من معيار Unicode، حيث يمكن للمستخدمين العثور على أحرف تبدو وكأنها جزء من الأبجدية اللاتينية العادية.

تقول شركة Google إن تقنية RETVec مُدرَّبة على أن تكون مرنة في التعامل مع العمليات على مستوى الأحرف، بما في ذلك عمليات الإدراج والحذف والأخطاء الإملائية والكلمات المتجانسة واستبدالات LEET والمزيد. يتم تدريب نموذج RETVec على ترميز أحرف جديد يمكنه ترميز جميع الأحرف والكلمات في مجموعة UTF-8 بكفاءة. ونتيجة لذلك، يعمل RETVec بشكل استثنائي عبر أكثر من 100 لغة دون الحاجة إلى جداول بحث أو أحجام ثابتة للمفردات.

Gmail nâng cấp bộ lọc thư rác lớn nhất trong nhiều năm - Ảnh 1.

بفضل RETVec، أصبح بإمكان Gmail الآن التعرف على الرسائل غير المرغوب فيها وتصفيتها بشكل أفضل

وتقول جوجل إن الأداء تغير بشكل كبير. إن الأساليب التي تستخدم أحجامًا ثابتة من المفردات أو جداول البحث عن الكلمات المتشابهة تتطلب موارد مكثفة. وفي الوقت نفسه، يحتوي RETVec على 200 ألف معلمة فقط بدلاً من الملايين، لذلك على الرغم من أن منصة تصفية البريد العشوائي السحابية من Google كبيرة بما يكفي، إلا أنه يمكن تشغيلها على جهاز محلي. RETVec هو برنامج مفتوح المصدر، وتأمل Google أن يعمل على القضاء على الهجمات التي تستخدم الرموز المتشابهة.

يعمل RETVec بشكل مشابه للطريقة التي تستخدم بها نماذج التعلم الآلي TensorFlow التشابه البصري لتحديد معنى الكلمات بدلاً من محتوى أحرفها الفعلي. وقد أدى هذا النهج إلى تحسينات كبيرة، حيث ذكرت جوجل أن استبدال مصنف البريد العشوائي في Gmail بـ RETVec أدى إلى تحسين معدلات اكتشاف البريد العشوائي على خط الأساس بنسبة 38% وتقليل الإيجابيات الخاطئة بنسبة 19.4%. لقد أدى استخدام RETVec إلى تقليل استخدام TPU الخاص بالنموذج بنسبة 83%، مما يجعل تنفيذ RETVec أحد أكبر الترقيات في السنوات الأخيرة. لقد قامت الشركة باختبار RETVec داخليًا على مدار العام الماضي وقامت بنشره على جميع حسابات Gmail للمستخدمين.


[إعلان رقم 2]
رابط المصدر

تعليق (0)

No data
No data

نفس الموضوع

نفس الفئة

نفس المؤلف

صورة

إرث

شكل

عمل

تطوير السياحة المجتمعية في ها جيانج: عندما تعمل الثقافة المحلية كـ"رافعة" اقتصادية
أب فرنسي يعيد ابنته إلى فيتنام للبحث عن والدتها: نتائج الحمض النووي لا تصدق بعد يوم واحد
كان ثو في عيني
فيديو مدته 17 ثانية من Mang Den جميل للغاية لدرجة أن مستخدمي الإنترنت يشتبهون في أنه تم تعديله

No videos available

أخبار

الوزارة - الفرع

محلي

منتج