رئيس التحرير: حسام حسين لبش
مدير التحرير: علي عجمي

صراع أنثروبيك وDeepSeek: اتهامات بسرقة بيانات Claude ونماذج منافسة

شارك

أعلنت شركة Anthropic الأمريكية المتخصصة في تطوير نموذج Claude عن اتهامات موجهة إلى ثلاث شركات صينية هي DeepSeek وMoonshot AI وMiniMax بسرقة بيانات من نموذجها لاستخدامها في تدريب نماذج ذكاء اصطناعي منافسة. وقالت في منشور رسمي إن المؤسسات الصينية استخدمت آلاف الحسابات لإجراء محادثات مطولة مع Claude بلغ مجموعها ملايين الرموز، بهدف استخلاص مخرجات عالية الجودة. وأشارت إلى أن الهدف كان اكتساب قدرات متقدمة في البرمجة والاستدلال المنطقي واستخدام الأدوات البرمجية. ووصفت Anthropic هذا المسار بأنه محاكاة لغش في الامتحان عبر تقليد ورقة الإجابة من نموذج متقدم.

أوضحت أن التقطير يمكن أن يكون مشروعًا داخل سياقات معينة إذا رُخّص له، لكن الشركة أكدت أن الأمر يصبح غير قانوني عندما يتم دون إذن أو بهدف نسخ قدرات نموذج متقدم لشركة أخرى. وأضافت أن الحملات شملت نحو 24 ألف حساب احتيالي و16 مليون تفاعل مع Claude، باستخدامها لاستخراج مخرجات عالية الجودة. وأشارت إلى أن الهدف كان استيلاء على قدرات متقدمة في البرمجة والاستدلال المنطقي واستخدام الأدوات البرمجية لتحسين النماذج الخادمة في الصين.

التقطير وأساليبه

حذّرت Anthropic من أن النماذج الناتجة عن تقطير غير مشروع قد تفقد إجراءات الأمان والضوابط التي تميز النموذج الأصلي، ما يفتح باب إساءة الاستخدام. وأوضحت أن هذه المخاطر قد تظهر عندما تُطرح قدرات حساسة مثل البرمجة والاستدلال دون طبقات حماية واسعة. كما أكدت أن وجود أنظمة أمان مدمجة في النماذج الأصلية يساعد في تقليل المخاطر، بينما يفقدها النماذج المقطرة قد يعرض المستخدمين للخطر.

انهالت ردود فعل المستخدمين على منصات التواصل بالتندر والميمز التي تشير إلى اعتماد الصناعة على جمع البيانات من الإنترنت. وتذكر بعض المستخدمين قضايا سابقة تواجهت بها الشركات المسؤولة عن النموذج، ومنها تسويات مالية ضخمة جراء ممارسات تدريب. كما أشار بعضهم إلى أن الشركات نفسها قد واجهت سابقًا جدلًا حول مصادر البيانات وكيفية استخدامها في التدريب.

دخل إيلون ماسك على الخط، ووجه اتهامات إلى Anthropic بأن تدريب نماذجها تم على بيانات من الإنترنت وتكبدت الشركة تكاليف قانونية كبيرة جراء ذلك. وذكر أن Anthropic ربما اعتمدت على بيانات الإنترنت وتكبدت تسويات مالية بمليارات الدولارات، ووصفها بأنها قضية تشكل نمطًا من النفاق. ردت شركة ماسك نفسها، xAI، بأنها أيضًا تعتمد على مجموعات بيانات ضخمة، لكنها أشارت إلى أن الفرق يكمن في النبرة وليس في الحجم وحده.

ذكرت وكالة رويترز أن DeepSeek ربما استخدمت أحدث شرائح Blackwell من Nvidia لتدريب نموذجها الأخير في مركز بيانات داخل منطقة منغوليا الداخلية، وهو أمر يثير تساؤلات حول الالتفاف على قيود التصدير. ورغم القيود الأمريكية على تصدير هذه الشرائح المتقدمة، يرى مسؤولون أمريكيون أن هذه الرقائق جُمّعت في مركز بيانات للشركة. وتستعد DeepSeek لإطلاق نموذجها الجديد خلال أيام، في ظل توقعات بأن يواجه نموذجها القادم منافسة أقوى من أقوى النماذج الأمريكية.

التأثير الدولي والتصعيد المستمر

تشير التطورات إلى أن العديد من النماذج الصينية المفتوحة المصدر تطرح تحديات جديدة، حيث تتيح أوزان التدريب للجمهور مما يمنح المطورين فرصًا لتعديلها بطرق لا تسمح بها النماذج الأمريكية المملوكة. وفي حال وصول هذه النماذج إلى أداء قريب من Claude وGemini وChatGPT فقد تتقلص القيمة التجارية للنماذج الأمريكية المغلقة. وتزداد الضغوط على الولايات المتحدة لتسريع الابتكار مع الحفاظ على معايير الأمان، بينما تظل الحرب الرقمية في مسار تصاعدي تقوده المنافسة على التقنيات المتقدمة.

مقالات ذات صلة