اصطلاح ابرداده از اواخر قرن بیستم شکل گرفت اما همین چند سال پیش توجه مردم به آن جلب شد و اهمیت درک این مفهوم و تأثیر آن برای دادهها، حریم خصوصی و امنیت افراد مشخص تر شد.
قبل از قضاوت کردن درباره اهمیت ابردادهها اول باید با خود این مفهوم و تأثیر آن بر زندگی دیجیتال خودتان آشنا شوید. در این مطلب یاد میگیریم که ابر داده چیست؟ چه اطلاعاتی درباره شما افشا میکند و برای مدیریت آن چه کارهایی میتوان انجام داد.
ابرداده چیست؟
ابردادهها، دادههایی هستند که سایر دادهها را توصیف میکنند. یعنی خود آنها به تنهایی چندان مفید نیستند و معمولاً خلاصهای از یک دیتاست بزرگتر هستند – که این دیتاست میتواند هر چیزی باشد از فایل صوتی و اطلاعات ارتباطی گرفته تا عکس و ویدیو. اما ابردادهها صرفاً یک افزونه مفید برای یک مجموعه اطلاعاتی کامل نیستند.
ابردادهها مثل اطلاعاتی درباره یک کتاب به همراه فهرست مطالب آن هستند. این اطلاعات محتوای کل کتاب را افشاء نمیکنند بلکه به شما امکان میدهند کتابها را به صورت درست طبقه بندی کنید بدون اینکه نیاز به خواندن کل آن داشته باشید.
در رابطه با نوع ابردادهها، میتوان آنها را بسته به نوع اطلاعاتی که درباره فایل اصلی ارائه میکنند طبقه بندی کرد. یک فایل میتواند دارای بیشتر از یک نوع ابرداده باشد که به سیستمهای کامپیوتری و کاربران امکان میدهد فایلها را بهتر سازماندهی و طبقه بندی کنند.
ابردادههای توصیفی
همانطور که از نام این ابردادهها مشخص است، این گروه محتوای فایل مورد نظر را توصیف میکنند. اطلاعات درون ابردادههای توصیفی معمولاً برای فیلتر و جستجو در یک منبع فایل عظیم – که معمولاً همه آنها از یک نوع هستند – استفاده میشود.
این گروه متداول ترین نوع محسوب میشوند. ابردادههای توصیفی معمولاً شامل نام تولیدکننده فایل، تاریخ ایجاد فایل و سایر اطلاعات مهم مثل ژانر، آلبوم و حتی تصویر کاور آلبوم برای فایلهای صوتی و نام نویسنده و شماره ISBN برای کتابها هستند.
ابردادههای ساختاری
ابردادههای ساختاری شامل اطلاعاتی درباره ترکیب و طرح دادههای درون یک فایل هستند. گرچه این اطلاعات برای فیلتر کردن قابل استفاده هستند اما معمولاً برای بررسی و سازماندهی عمیق تر فایلها مورد استفاده قرار میگیرند.
ابردادههای ساختاری انواع مختلفی دارند مثل طول فایل صوتی، تعداد صفحات یک کتاب، فهرست مطالب و عنوان فصلها.
ابردادههای مدیریتی
ابردادههای مدیریتی ماهیت فنی تر دارند. این ابردادهها حاوی اطلاعاتی درباره نحوه باز و اجرا کردن یک فایل از جمله اطلاعاتی مثل فرمت فایل هستند. این ابردادهها تقریباً در همه فایلها وجود دارند و دستگاه، نرمافزار یا اپلیکیشنی که از آن برای اجرای فایل استفاده میکنید آنها را میخوانند.
در بعضی از مواقع، ابردادههای مدیریتی به عنوان ابردادههای مربوط به حقوق مالکیت دسته بندی شده و اطلاعات مربوط به مالکیت معنوی فایل و اینکه چه شخصی حق دسترسی به آن را دارد را پوشش میدهد.
ابردادههای قانونی
ابردادههای قانونی، اطلاعات مربوط به وضعیت قانونی فایل را مشخص میکنند از جمله اینکه حق کپی کردن فایل متعلق به چه شخصی است، این فایل حاوی چه مجوزهای عمومی یا خصوصی است و سایر توافقنامههای قانونی.
چرا ابردادهها اهمیت دارند؟
صرف نظر از فرمت مورد استفاده و اینکه فایل را شما ساخته اید، از دوستتان گرفته اید یا از اینترنت دانلود کرده اید، ابردادهها نقش مهمی در زندگی دیجیتال ما دارند و هر چند ممکن است اطلاعاتی که ابردادهها با خود به همراه دارند مختصر و اغلب کم اهمیت باشند اما امکان دستکاری و سرهم کردن آنها برای نقض حریم خصوصی و امنیت کاربران وجود دارد.
اگر ابردادههای یک یا چند فایل شما افشا شود، محتوای فایل افشا نمیشود بلکه به چنین سوالاتی پاسخ میدهد:
- این فایل متعلق به چه کسی است؟
- فایل حاوی چه نوع اطلاعاتی است؟
- فایل کجا تولید و ذخیره شده است؟
- تولید فایل چه موقع انجام شده و آیا مالک فعلی آن را ویرایش کرده است؟
اما باز هم پاسخ همه این سوالات مختصر و کوتاه به نظر میرسد. پس چنین اطلاعات به ظاهر سطحی چه چیزهایی درباره شخص افشا میکنند؟
ابردادهها چه اطلاعاتی را درباره شما افشا میکنند؟
اطلاعات جمع آوری شده از فایلها و اقدامات کاربران در اینترنت به خودی خود محدود هستند اما مشکل وقتی ایجاد میشود که ابردادههای مربوط به یک شخص به مرور زمان از هزاران منبع مختلف جمع آوری میشوند. این اطلاعات میتوانند مشخص کنند که شما از طریق تلفن یا ایمیل بیشتر با چه شخصی در تماس هستید حتی اگر محتوای مکالمات شما را مشخص نکنند.
با توجه به ظهور ابردادههایی که اطلاعات جدیدی را افشاء میکنند (مثل عکسها) به تدریج اطلاعات بیشتری درباره شما منتشر میشود. سلفی و عکسهای پی در پی که از غذاهای خودمان منتشر کرده و در توئیتر و اینستاگرام منتشر میکنیم میتوانند اطلاعاتی درباره محلهایی که زیاد به آنها سر میزنیم افشا کنند حتی اگر آنها را تگ نکرده باشیم – دقیقاً به همین دلیل است که دوربین گوشی مجوز دسترسی به لوکیشن را از شما درخواست میکند.
ابردادههای افشا شده به تنهایی تهدیدی برای حریم خصوصی محسوب میشوند. هر شخصی که به این اطلاعات دسترسی داشته باشد میتواند حرکات و الگوهای ارتباطی شما را تشخیص دهد اما با در اختیار داشتن اطلاعات کافی و وجود یک سیستم هوش مصنوعی قوی حتی امکان پیش بینی حرکات و فعالیتهای شما در آینده هم وجود خواهد داشت.
شاید شما متوجه این موضوع نشوید اما نتیجه گیریهایی که سیستمهای تحلیلی پیشرفته میتوانند انجام دهند بسیار مهم هستند. به هر حال شرکتهایی که شما را زیرنظر دارند در جریان هستند که چه موقع با شرکت بیمه یا خدمات سلامت تماس گرفته و چه نوع اطلاعاتی را در اینترنت جستجو کرده اید.
سایت Security.org تحقیقی انجام داد که در آن انواع دادههای جمع آوری شده توسط سایتهای بزرگ اینترنتی مورد بررسی قرار گرفت. این تحقیق شبکههای اجتماعی بزرگی مثل فیسبوک، توئیتر و حتی گوگل را مورد بررسی قرار داد و مشخص شد که اکثر آنها اطلاعاتی درباره کاربران جمع آوری و نگه داری میکنند که نیازی به آن ندارند.
از جمله این اطلاعات میتوان به شناسههای کاربری، اطلاعات شخصی، موقعیت جغرافیایی و فعالیتهای کاربران اشاره کرد. در اکثر مواقع کاربران نمیتوانند مانع از جمع آوری این اطلاعات شوند حتی اگر کوکیها و ابزارهای رهگیری را محدود کرده باشند.
آیا شما از امنیت و حریم خصوصی خودتان حفاظت میکنید؟
برای پوشش هویت و ردپای خودتان در فضای آنلاین از وی پی ان استفاده کنید، همیشه حداقل تعداد کوکی و ابزارهای تعقیب را قبول کنید و از افزونههای مقابله با پیگیری فعالیت کاربران استفاده کنید. در رابطه با اطلاعات شخصی، حتماً قبل از بارگذاری اطلاعات بر روی اینترنت یا ارسال آنها برای دوستانتان، ابردادهها را از آنها حذف کنید.
گرچه پیشگیری از ردپا گذاشتن در فضای آنلاین تقریباً غیرممکن است به خصوص در سایتهایی که در آنها حساب کاربری دارید اما میتوانید حجم اطلاعاتی که دیگران درباره شما جمع آوری میکنند را به حداقل برسانید.