Skip to content

ما هي ترميز البيانات ونقلها؟

مقدمة

عندما ترسل صورة لصديق، أو رسالة عبر وي تشات، أو تحمل لعبة بحجم عدة جيجابايت، كيف تمر هذه المعلومات عبر نصف الكرة الأرضية لتظهر سليمة على شاشتك؟ يركز هذا الفصل على سؤال يحير المبتدئين: لماذا أصبح الملف الذي استلمته رموزاً غير مفهومة؟ انطلاقاً من هذا السؤال، سنكتشف الركائز الأساسية الثلاث للحوسبة: الترميز، والتخزين، والنقل.

ماذا ستتعلم في هذه المقالة؟

بعد إكمال هذا الفصل، ستكتسب:

  • قدرة على تشخيص الرموز المشوهة: عند مواجهة "ملف بأحرف غريبة"، يمكن تحليل السبب من منظور الترميز
  • وعي متعدد المنصات: معرفة لماذا يجب الانتباه لتنسيق الترميز وترتيب البايتات عند تبادل البيانات
  • رؤية شاملة للترميز: فهم كيف يمثل الحاسوب كل شيء بـ 0 و 1 -- من النصوص إلى الصور إلى الكائنات المعقدة
  • أساس للتعلم المستقبلي
الفصلالمحتوىالمفهوم الأساسي
الفصل 1ترميز الأحرفASCII، UTF-8، GBK
الفصل 2تخزين البياناتالثنائي، ترتيب البايتات
الفصل 3نقل البياناتالتسلسل، الضغط

0. مقدمة: لماذا تتحول الملفات إلى "لغة غير مفهومة"؟

تخيل أنك تستلم ملفاً مهماً من زميل، تفتحه بالنقر المزدوج فتجده مليئاً بأحرف غريبة مثل "浣犲ソ" أو "ä½ å¥½".

الحقيقة هي أن الغالبية العظمى من所谓 "الملفات التالفة" لها تفسير واحد فقط -- حاسوبك "لم يجد القاموس الصحيح".

你收到的文件内容(字节流)
0xE40xBD0xA00xE50xA50xBD
用什么规则来「读」它?
正确(UTF-8)
你好
发件人用 UTF-8 存储了「你好」,你也用 UTF-8 读,当然正确。
核心领悟:字节本身没有含义,编码规则决定了字节变成什么字。发件人用 UTF-8 存,你用 GBK 读,当然面目全非。

الفهم الأساسي: القواميس غير المتطابقة

البايتات (تسلسلات من 0 و 1) ليس لها معنى مطلق في حد ذاتها. "قواعد الترميز" التي وضعها البشر هي ما يمنحها المعنى.

إذا استخدم المرسل قاموس UTF-8 لترجمة الأحرف الصينية إلى أرقام، وأنت تحاول قراءة هذه الأرقام بقاموس GBK، فالنتيجة بطبيعة الحال ستكون رموز مشوهة.


1. ما هو ترميز البيانات؟ (تحويل كل شيء إلى أرقام)

ترميز البيانات (Encoding) هو إنشاء "قاموس ثنائي الاتجاه" يربط المعلومات من العالم الحقيقي (نص، ألوان، صوت) بـ 0 و 1 التي يفهمها الحاسوب.

1.1 من النص إلى الأرقام: من ASCII إلى Unicode

المرحلة الأولى: ASCII -- 128 حرفاً فقط، كافية للإنجليزية.

المرحلة الثانية: عصر الانقسام -- كل دولة صنعت قاموسها الخاص (GBK، Shift_JIS...)، مما سبب فوضى.

المرحلة الثالثة: Unicode يوحد الكل -- رقم فريد لكل حرف في العالم. UTF-8 هو قاعدة التخزين الأكثر شيوعاً: الإنجليزية 1 بايت، الصينية 3 بايت.

字符Unicode 码点UTF-8 字节字节数
U+4F60
0xE40xBD0xA0
3 字节
U+597D
0xE50xA50xBD
3 字节
U+0020
0x20
1 字节
HU+0048
0x48
1 字节
eU+0065
0x65
1 字节
lU+006C
0x6C
1 字节
lU+006C
0x6C
1 字节
oU+006F
0x6F
1 字节
字符数8
UTF-8 总字节数12
平均每字符1.5 字节
提示:英文字母在 UTF-8 中只占 1 字节,常用汉字占 3 字节,Emoji 占 4 字节。这就是为什么处理中文文本时,“字符数”和“字节数”是两个完全不同的概念。

1.2 كيف تتحول الألوان والأصوات إلى أرقام؟

  • ترميز الصور: تتكون الصورة من ملايين البكسلات. كل لون له رقم (مثل #FF0000 للأحمر).
🖼️ 图片是如何变成数字的?(悬停在像素方块上看看)
💻 计算机实际看到的:
#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#3B82F6#3B82F6#F3F4F6#F3F4F6#3B82F6#3B82F6#F3F4F6#F3F4F6#3B82F6#3B82F6#F3F4F6#F3F4F6#3B82F6#3B82F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#3B82F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#3B82F6#F3F4F6#3B82F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#3B82F6#F3F4F6#F3F4F6#F3F4F6#3B82F6#3B82F6#3B82F6#3B82F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6#F3F4F6
将鼠标悬停在左侧画布的方块上
💡 原理解析:一张 1080p 的高清壁纸,其实就是 207 万 个像左边这样密密麻麻的小色块组成的。计算机把这两百多万个颜色的编号(如 #FF0000)按顺序记录下来,图片就变成了几百万个数字的集合。
  • ترميز الصوت: الصوت موجة. نقيس ارتفاع الموجة 44,100 مرة في الثانية (أخذ عينات)، ونسجل القيم.
声音是如何变成数字的?(拖拽滑块调整采样率)
低音质 (严重失真)高音质 (贴近原声)
转译后的数字(高度):
0530-520530-520
说明:灰色的虚线是真实的连贯声波(大自然的模拟信号)。蓝色柱子是我们每隔一段时间去测量它的高度(数字信号)。采样频率越密集,记录下来的数字就越多,恢复出来的声音就越清晰逼真,但产生的文件也随之飙升。

2. جسر التخزين: قبل الإرسال، يجب وضع البيانات في مكان ما

بعد ترميز البيانات، قبل إرسالها، يجب تخزينها. هناك قانون حديدي: التخزين الأسرع عادةً أغلى ثمناً وأقل سعة.

L0CPU 寄存器极快
L1CPU 缓存(Cache)很快
L2内存(RAM)
L3SSD(固态硬盘)较快
L4机械硬盘(HDD)
L2内存(RAM)
访问速度几十 ~ 100 纳秒
典型容量几 GB ~ 几百 GB
单价(每GB)适中(约 ¥30/GB)
生活类比:你打开的浏览器标签页——断电就没了,但当前工作全在这里。
实际用途:运行中的程序、操作系统、当前打开的文件都住在内存里。内存不够了→程序卡顿甚至崩溃。
提示:越快越贵,越慢越大。CPU 缓存极快但只有几 MB;机械硬盘虽慢但便宜又能存 TB。操作系统会自动在各层之间搬运数据——这叫存储层次结构

نظام التشغيل يعمل كمدير مستودعات ذكي للغاية: يخزن الأفلام والألعاب في التخزين البطيء والكبير (SSD)، وعند اللعب ينقل البيانات الضرورية إلى الذاكرة السريعة (RAM)، وعند الإغلاق يفرغ الذاكرة للاستخدامات الأخرى.


3. ما هو نقل البيانات؟ (إرسال 0 و 1 في رحلة)

3.1 نقل الأجهزة والشبكات المحلية

داخل صندوق الحاسوب أو بين حواسيب قريبة، نواجِه تحدياً فيزيائياً بحتاً. اليوم، USB Type-C و PCIe يستخدمون النقل التسلسلي (قناة واحدة رئيسية).

选择传输方式,然后点"发送数据包"
Tx
发送方
10110010
1 条线
Rx
接收方
已发送0 / 8 位
传输速率1 位/次
状态就绪
提示:等等,串行不是更慢吗?
表面上是的——但现代串行接口(USB 4、PCIe)传输频率高达每秒 数百亿次,而并行线路之间会产生 信号串扰(Crosstalk),反而限制了速度。所以高速接口全面转向了串行。

3.2 نقل الشبكات الواسعة والإنترنت

عندما يجب أن تصل بياناتك إلى خادم في بلد آخر، تمر عبر كابلات بحرية ومحطات أساسية وموجهات. التحدي هنا هو التسامح مع الأخطاء.

  1. التقسيم إلى حزم: الشبكة تقطع الفيديو إلى آلاف "حزم البيانات" (~1500 بايت لكل منها)
  2. المجموع الاختباري (Checksum): حساب رمز تحقق قبل الإرسال
  3. إعادة إرسال TCP: إذا فُقدت حزمة أو تضررت، يطلب المستلم إعادة إرسالها

بفضل آلية TCP هذه، حتى على واي فاي غير مستقر، الملفات المحمّلة دائماً سليمة 100%.


4. التطبيق النهائي: من التقاط صورة إلى مشاركتها على وسائل التواصل

📸 照片上传的完整旅程从按下快门到云端备份,数据经历了什么?
1
编码
2
存储
3
传输
🔢编码阶段等待执行
☀️
光线
物理信号
📷
传感器
CMOS/CCD
📊
RAW 数据
24MB / 4860万像素
🗜️
JPEG 压缩
有损压缩
📄
JPEG 文件
3.2MB
第一步:编码 — 把光变成数字
1相机传感器把光信号转换成 RGB 数值(每个像素 3 × 8 bit = 24 bit)
2整张照片 4860 万像素 × 24 bit ≈ 140 MB 的原始数据
3JPEG 算法分析像素相似性,去掉人眼不敏感的信息,压缩到 3 MB

5. جدول المصطلحات

المصطلحالشرح
Bit (b)أصغر وحدة، يمكن أن تكون فقط 0 أو 1
Byte (B)8 بتات معاً. الوحدة الأساسية لحجم الملفات
Character Set"فهرس القاموس"، يحدد أي الحروف موجودة
Encoding"قاعدة التخزين"، تحدد أي بايتات تقابل كل حرف
RAMذاكرة عمل سريعة لكنها تُفقد عند انقطاع الطاقة
SSDمحرك أقراص الحالة الصلبة، تخزين دائم سريع
Serial / Parallelتسلسلي = قناة واحدة طابور؛ متوازي = قنوات متعددة معاً
Checksumرمز تحقق مرفق مع البيانات المرسلة
TCPبروتوكول التحكم بالنقل، يضمن التسليم سليماً 100%

الملخص

  • لماذا يبدو نفس الملف مشوهاً عند استلامه؟ البيانات ليست تالفة، فقط برنامجك استخدم القاموس الخاطئ (مشكلة ترميز).
  • لماذا كابلات Type-C أنحف لكن أسرع؟ لأنها كانت سابقاً عربات متعددة تسير بالتوازي (متوازي)، والآن قطار سريع على مسار مخصص (تسلسلي).
  • لماذا الألعاب الكبيرة تستغرق وقتاً طويلاً في التحميل؟ لأنها تحتاج لنقل عشرات الجيجابايت من القرص البطيء إلى الذاكرة السريعة.

جوهر الحوسبة بسيط: تحويل (ترميز)، تخزين (حفظ)، وإرسال (نقل) كل المعلومات كنبضات كهربائية.