"آلة واي باك" التابعة لأرشيف الإنترنت، وهي مستودع حاسم للتاريخ الرقمي، تواجه تحديًا وجوديًا مع قيام عدد متزايد من المنافذ الإعلامية البارزة بتقييد وصولها بنشاط إلى محتواها عبر الإنترنت. نفذت 241 مؤسسة إخبارية على الأقل عبر تسع دول إجراءات حجب، وفقًا لبحث صادر عن مؤسسة نيمان للصحافة بجامعة هارفارد. تهدد هذه الخطوة بمحو أجزاء كبيرة من الويب العام من السجل التاريخي، مما يعرض الأبحاث المستقبلية والمساءلة الصحفية للخطر.
لثلاثة عقود، عملت منصة archive.org كمكتبة رقمية لا غنى عنها، تحافظ بدقة على محتوى الإنترنت. تحتوي "آلة واي باك" الخاصة بها الآن على أكثر من مليار صفحة ويب مؤرشفة، مما يوفر موردًا حاسمًا للصحفيين والمؤرخين والباحثين والمهنيين القانونيين الذين يسعون للتحقق من المعلومات المحذوفة عبر الإنترنت أو استردادها. سمحت هذه المجموعة الواسعة بإجراء عدد لا يحصى من التحقيقات، موفرة سجلًا ثابتًا في مشهد رقمي دائم التغير.
ومع ذلك، يواجه هذا المشروع غير الربحي الذي يتخذ من سان فرانسيسكو مقرًا له الآن تحديًا كبيرًا، ومن المفارقات، من الكيانات نفسها التي تعتمد غالبًا على خدماته: وسائل الإعلام نفسها. يرفض عدد كبير من دور النشر الكبرى بشكل منهجي وصول أرشيف الإنترنت إلى محتواها. هذا ليس خللًا فنيًا؛ إنه قرار متعمد من الشركات.
وثقت مؤسسة نيمان للصحافة بجامعة هارفارد أن 241 منفذًا إخباريًا متميزًا في تسع دول قد نشرت إجراءات لحجب زواحف الويب الخاصة بالأرشيف. وتشمل هذه الأسماء المعترف بها عالميًا مثل "الغارديان" البريطانية، و"نيويورك تايمز"، و"لوموند" الفرنسية، وأكبر تكتل صحفي أمريكي، "يو إس إيه توداي كو". المفارقة هنا صارخة.
نشرت "يو إس إيه توداي" نفسها مؤخرًا تقريرًا مفصلًا عن جهود هيئة الهجرة الأمريكية (ICE) لحجب المعلومات المتعلقة بسياسات الاحتجاز الخاصة بها. وقد اعتمد هذا التحقيق، وهو شهادة على الصحافة الدقيقة، بشكل كبير على البيانات المحفوظة بواسطة "آلة واي باك" التابعة لـ archive.org. الشركة نفسها التي استفادت مباشرة من وجود الأرشيف تمنع الآن الأرشيف بنشاط من حفظ تقاريرها الخاصة.
الأرقام لا تتوافق. توضح دور النشر سببًا واضحًا لهذا التحول في السياسة: الخوف المتزايد من الذكاء الاصطناعي. تخشى هذه المنظمات أن تستغل شركات الذكاء الاصطناعي، بما في ذلك عمالقة الصناعة مثل OpenAI و Google، الأرشيف كمصدر بيانات ضخم وغير مصرح به.
يعتقدون أن كيانات الذكاء الاصطناعي هذه ستحصد محتواها الصحفي لتدريب نماذج لغوية كبيرة، كل ذلك دون إذن صريح أو أي شكل من أشكال التعويض المالي. هنا تتجلى ديناميكيات القوة حقًا. عبر غراهام جيمس، المتحدث باسم "نيويورك تايمز"، عن هذا القلق مباشرة. صرح جيمس: "المشكلة هي أن محتوى التايمز على أرشيف الإنترنت تستخدمه شركات الذكاء الاصطناعي في انتهاك لقانون حقوق النشر للمنافسة معنا مباشرة"، مؤكدًا التهديد الاقتصادي المتصور.
يؤطر هذا المنظور الأرشيف ليس كصالح عام، بل كقناة للاستغلال التجاري من قبل أطراف ثالثة. في الواقع، تشير البيانات التي جمعها archive.org نفسه إلى زيادة في نشاط الروبوتات على موقعه الإلكتروني. أكد مارك غراهام، مدير "آلة واي باك"، لمجلة "وايرد" أن عدة شركات، في أوقات مختلفة، وصلت إلى الأرشيف بعشرات الآلاف من الطلبات في الثانية.
أدت هذه الاستفسارات المكثفة في بعض الأحيان إلى إجهاد خوادم الأرشيف. لم يكن الأرشيف مجهزًا لهذا النوع من استخراج البيانات المستمر وعالي الحجم، حيث يعمل وفق نموذج مختلف. التزام أرشيف الإنترنت الأساسي هو بالإنترنت المفتوح.
يعكس مبدأه التوجيهي، "مثل المكتبة الورقية، نوفر وصولًا مجانيًا للباحثين والمؤرخين والعلماء والأشخاص ذوي الإعاقة البصرية والجمهور العام. مهمتنا هي توفير وصول عالمي إلى جميع المعارف"، روحًا راسخة لمشاركة المعلومات غير المقيدة. هذه المهمة تجعل من الصعب بطبيعتها على المنظمة غير الربحية استبعاد روبوتات أو زواحف معينة بشكل انتقائي دون المساس بمبادئها الأساسية.
أدى هذا الالتزام بالنموذج المفتوح، وبشكل متناقض، إلى عقوبات من دور النشر ووسائل الإعلام الكبرى، مما خلق طريقًا مسدودًا. قدمت منظمة حقوق الإنسان "مؤسسة الحدود الإلكترونية" (EFF)، التي تركز على القضايا الرقمية، تشبيهًا موجزًا لتسليط الضوء على الآثار المترتبة. علق ممثل عن EFF: "تخيل ناشر صحيفة يعلن أنه لن يسمح للمكتبات بالاحتفاظ بنسخ من ورقته". يؤكد هذا التشبيه التهديد الأساسي للحفظ طويل الأجل للمعلومات العامة والسجل التاريخي.
تمتد الآثار إلى ما هو أبعد بكثير من النزاعات التجارية. عبر أكثر من 100 صحفي عن دعمهم لأرشيف الإنترنت بتوقيع رسالة مفتوحة. في بيانهم الجماعي، أكدوا الدور الحاسم للأرشيف: "في مشهد إعلامي رقمي تختفي فيه المقالات بسبب تعطل الروابط، أو الاندماج المؤسسي، أو تخفيض التكاليف، يعتمد الصحفيون غالبًا على "آلة واي باك" التابعة للأرشيف لاستعادة الصفحات التي قد تُفقد لولا ذلك.
"بدون هذا العمل المستمر لحفظ الويب، ستكون أجزاء كبيرة من تاريخ الصحافة الحديث قد فُقدت بالفعل." يسلط هذا الضوء على حاجة ملموسة وفورية لاستمرار عمل الأرشيف، خاصة وأن المحتوى الرقمي يثبت أنه أكثر زوالًا من المطبوعات. هذه ليست المرة الأولى التي يجد فيها أرشيف الإنترنت نفسه يقاتل من أجل وجوده. في سبتمبر 2024، أدى هجوم إلكتروني إلى اختراق بيانات 31 مليون حساب مستخدم، مما شكل ضربة قاسية لأمن المنظمة التشغيلي وثقة الجمهور.
في العام نفسه، تعرض الأرشيف لهزيمة قانونية كبيرة في نزاع حقوق النشر "Hachette ضد Internet Archive" في محكمة استئناف أمريكية. رفعت دور نشر كبرى، بما في ذلك Hachette و Penguin Random House و HarperCollins و Wiley، دعوى قضائية بنجاح بشأن برنامج إعارة الكتب الإلكترونية المجاني الذي بدأه الأرشيف خلال جائحة COVID-19.
أجبر الحكم على إزالة أكثر من 500,000 كتاب من البرنامج، ويواجه archive.org الآن مطالبات تعويض محتملة تصل إلى ملايين الدولارات. كانت هذه المعارك السابقة مهمة، لكنها مختلفة جوهريًا. مقارنة بتلك النكسات، التي كانت إما فنية أو قضائية، فإن التهديد الحالي الذي تفرضه الحصارات الإعلامية أكثر تعقيدًا من الناحية الهيكلية، وربما أكثر ديمومة.
لا يمكن حل هذا التحدي بحكم قضائي واحد أو تصحيح برمجي. إنه النتيجة التراكمية للعديد من القرارات المستقلة للشركات التي تقوض بشكل جماعي المهمة الأساسية لـ "آلة واي باك": الأرشفة الشاملة للويب العام. اتبع النفوذ، لا الخطاب؛ شركات الإعلام تؤكد سيطرتها على بياناتها، حتى على حساب الوصول العام.
قال مارتن فيرينسن، صحفي إعلامي ومؤسس الموقع الألماني socialmediawatchblog.de، لـ DW إن archive.org يمثل السلسلة الوظيفية الوحيدة لحفظ الويب المفتوح. وحذر من أنه إذا كان الأرشيف غير قادر على أداء وظائفه، فإن التداعيات ستكون كبيرة. أوضح فيرينسن: "ملايين الملاحظات المرجعية في ويكيبيديا تفقد جذورها. ستصبح الأبحاث حول مساءلة المنصات — أي شروط العمل العامة صالحة متى، وتغييرات قواعد الإشراف — أكثر صعوبة بشكل ملحوظ، وتتوقف الأدلة الرقمية التي يمكن أن تصمد في المحكمة عن الوجود".
وأضاف أن قيام وسائل الإعلام بحجب الوصول إلى أرشيف تعتمد عليه هي نفسها أمر غير منطقي على الإطلاق. لا يمكن المبالغة في الأهمية الأوسع لهذا الصراع. عندما تقيد المؤسسات الإخبارية الكبرى أرشفة محتواها، فإنها تخلق فعليًا ذاكرة انتقائية للإنترنت.
يؤثر هذا الإجراء بشكل مباشر على قدرة الأجيال القادمة على فهم الماضي، والتحقق من الروايات التاريخية، ومحاسبة السلطة. إنه يخلق فراغًا حيث يمكن التلاعب بالحقائق أو اختفائها ببساطة. هذا ما لا يخبرونك به: هذه معركة من أجل سلامة السجل الرقمي نفسه، وحق الجمهور في الوصول إليه.
أشار مارك غراهام من "آلة واي باك" إلى أنه يجري مناقشات مستمرة مع وسائل الإعلام، بهدف استعادة الوصول. يقدم تقييمه الأولي تحذيرًا صارخًا: "لا شك أن الإغلاق العام المتزايد للويب العام يؤثر على قدرة المجتمع على فهم ما يجري في عالمنا." حدد فيرينسن مسارين محتملين لحل هذا الصراع المتصاعد. يدعو إلى حوار بين الناشرين يؤسس فصلًا تقنيًا واضحًا بين الأرشفة وتدريب الذكاء الاصطناعي، معتبرًا هذا هو جوهر النزاع الحقيقي.
على المدى المتوسط، يعتقد أن أرشيفات الويب تحتاج إلى وضع قانوني خاص. وبالنظر إلى المستقبل، يرى فيرينسن أن أرشفة الويب يجب أن تُعامل كبنية تحتية عامة، بدلًا من أن تظل معتمدة على منظمة غير حكومية واحدة مقرها سان فرانسيسكو. سيتوقف مستقبل الذاكرة الرقمية، ووصول الجمهور إليها، على ما إذا كانت هذه المناقشات ستسفر عن حلول ملموسة أم أن البوابات الرقمية ستستمر في الإغلاق.
نقاط رئيسية
— - أكثر من 240 منفذًا إخباريًا، بما في ذلك "نيويورك تايمز" و"الغارديان"، تحجب "آلة واي باك" التابعة لأرشيف الإنترنت.
— - تستشهد شركات الإعلام بمخاوف من أن شركات الذكاء الاصطناعي تستخدم المحتوى المؤرشف لتدريب النماذج دون إذن أو تعويض.
— - يعرض هذا الحصار الحفظ طويل الأجل للأخبار الرقمية والسجلات التاريخية الهامة للخطر.
— - يقترح الخبراء حلولًا مثل الفصل التقني لوصول الذكاء الاصطناعي وإنشاء أرشفة الويب كبنية تحتية عامة.
المصدر: DW









