DapAnHay giới thiệu đến các em nội dung Bài 3: Một số kiểu dữ liệu và dữ liệu văn bản để giúp các em tìm hiểu các kiểu dữ liệu trong máy tính. Đồng thời, nội dung bài học còn giúp các em tìm hiểu về cách biểu diễn thông tin và dữ liệu trong máy tính. Nội dung chi tiết tham khảo dưới đây!
- Khi đưa vào máy tính thông tin được chuyển thành dữ liệu. Dữ liệu trên máy cũng cần được phân loại cho phù hợp với các phép xử lí trong máy tính. Ví dụ, đối với các dữ liệu là số có thể tính toán và so sánh. Còn đối với các dữ liệu dạng văn bản thì có thể tách, ghép, so sánh.
- Việc mã hoá thông tin thành dữ liệu nhị phân được gọi là biểu diễn thông tin. Biểu diễn thông tin là bước đầu để có thể đưa thông tin vào máy tính.
- Biểu diễn thông tin trong máy tính là cách mã hoá thông tin. - Các kiểu dữ liệu thường gặp là văn bản, số hình ảnh, âm thanh và lôgic. - Việc phân loại dữ liệu để có cách biểu diễn phù hợp nhằm tạo thuận lợi đó việc xử lý thông tin trong máy tính. |
---|
- Hình 3.2 là sơ đồ phân loại các kiểu dữ liệu được đề cập trong chương trình tin học phổ thông
Hình 3.2. Sơ đồ phân loại các kiểu dữ liệu
a) Bảng mã ASCII
- Bảng mã ASCII mở rộng sử dụng 8 bit để biểu diễn một kí tự.
- Bảng mã được dùng phổ biến nhất trong tin học là “bảng mã chuẩn của Mỹ để trao đổi thông tin” (American Standard Code for Information Interchange viết tắt là ASCII).
- Bảng mã 7 bit chỉ đủ dùng cho tiếng Anh, trong khi đó nhiều quốc gia có các kí tự riêng, như tiếng Hy Lạp có các kí tự đ, B,Y; tiếng Nga có các kí tự 6, I, A. Do đó, người ta đã mở rộng bảng mã 7 bit thành bảng mã 8 bit gọi là bảng mã ASCII mở rộng, cho phép mã hoá 256 kí tự, trong đó giữ nguyên 128 kí tự cũ.
Bảng ASCII mở rộng
b) Bảng mã Unicode và tiếng Việt trong Unicode
Bảng mã Unicode:
- Unicode là bảng mã hợp nhất quốc tế, cho phép tạo ra các ứng dụng đa ngôn ngữ. Mỗi kí tự Unicode có thể được mã hoá bởi nhiều byte.
- Đầu những năm 1980, người ta đã đề xuất một chương trình quốc tế nhằm xây dựng một bảng mã hợp nhất dùng chung cho mọi quốc gia, gọi là Unicode.
- Unicode thực tế là một bộ tiêu chuẩn biểu diễn kí tự văn bản trong máy tính, cho phép sử dụng nhiều hơn 8 bit để biểu diễn các kí tự thuộc nhiều ngôn ngữ khác nhau trên thế giới.
- Ưu điểm:
+ Cho phép mã hoá hàng trăm nghìn kí tự khác nhau.
+ Tránh được tình trạng thiếu nhất quán do các quốc gia dùng các mặt chữ giống nhau nhưng mã khác nhau.
- Việc sử dụng Unicode tạo ra những ứng dụng đa ngôn ngữ, sử dụng đồng thời nhiều ngôn ngữ khác nhau như các trình duyệt web, ngôn ngữ lập trình, các phần mềm | ứng dụng, ...
Tiếng Việt trong Unicode:
- Năm 2001 Việt Nam đã ban hành Tiêu chuẩn TCVN 6909:2001 về Bộ mã kí tự Tiếng Việt 16-bit để sử dụng chung. Tiêu chuẩn này hoàn toàn phù hợp với tiêu chuẩn quốc tế về Unicode.
- Năm 2017, Việt Nam cũng đã ban hành quy định bắt buộc sử dụng UTF-8 để biểu diễn bộ kí tự Unicode trong máy tính
⇒ Như vậy, hiểu một cách ngắn gọn, các bảng mã ASCII và Unicode quy định cách biểu diễn kí tự.
c) Số hoá văn bản
- Tệp văn bản là định dạng lưu trữ ở bộ nhớ ngoài.
- Việc số hoá văn bản được thực hiện bằng các phần mềm soạn thảo văn bản như Word (của Microsoft) hay Writer (của Open Office).
- Bảng mã ASCII mở rộng sử dụng 8 bit để biểu diễn một kí tự. - Unicode là bảng mã hợp nhất quốc tế cho phép tạo ra các ứng dụng đa ngôn ngữ. Mỗi kí tự Unicode có thể được mã hoá bởi nhiều byte. |
---|
Bài tập 1: Trong máy tính có các kiểu dữ liệu nào?
Hướng dẫn giải:
Các kiểu dữ liệu trong máy tính: Văn bản, số, lôgic, đa phương tiện (âm thanh, hình ảnh), ....
Bài tập 2: Bảng mã ASCII mở rộng sử dụng bao nhiêu bit để biểu diễn một kí tự.
a. 8 bit
b. 1 bit
c. 1 đến 8 bit
d. 3 bit
Hướng dẫn giải:
Bảng mã ASCII mở rộng sử dụng 8 bit để biểu diễn một kí tự.
Đáp án a
Qua bài học các em cần nắm được các về:
- Nêu được các kiểu dữ liệu trong máy tính
- Trình bày được các quy định cách biểu diễn kí tự của bảng mã ASCII và Unicode
Các em có thể hệ thống lại nội dung kiến thức đã học được thông qua bài kiểm tra Trắc nghiệm Tin học 10 Kết nối tri thức Chủ đề 1 Bài 3 cực hay có đáp án và lời giải chi tiết.
Vào năm nào Việt Nam đã ban hành Bộ mã kí tự Tiếng Việt 16-bit?
Có bao nhiêu kiểu dữ liệu thường gặp?
Tập truyện tranh quen thuộc với nhiều bạn nhỏ “Đô - rê - mon” cho em dạng thông tin gì?
Câu 4-10: Mời các em đăng nhập xem tiếp nội dung và thi thử Online để củng cố kiến thức về bài học này nhé!
Các em có thể xem thêm phần hướng dẫn Giải bài tập Tin học 10 Kết nối tri thức Chủ đề 1 Bài 3để giúp các em nắm vững bài học và các phương pháp giải bài tập.
Khởi động trang 16 SGK Tin học 10 Kết nối tri thức - KNTT
Hoạt động 1 trang 16 SGK Tin học 10 Kết nối tri thức - KNTT
Câu hỏi mục 1 trang 17 SGK Tin học 10 Kết nối tri thức - KNTT
Hoạt động 2 trang 17 SGK Tin học 10 Kết nối tri thức - KNTT
Câu hỏi mục 2 trang 18 SGK Tin học 10 Kết nối tri thức - KNTT
Luyện tập trang 19 SGK Tin học 10 Kết nối tri thức - KNTT
Vận dụng trang 19 SGK Tin học 10 Kết nối tri thức - KNTT
Trong quá trình học tập nếu có thắc mắc hay cần trợ giúp gì thì các em hãy comment ở mục Hỏi đáp, Cộng đồng Tin học DapAnHay sẽ hỗ trợ cho các em một cách nhanh chóng!
Chúc các em học tập tốt và luôn đạt thành tích cao trong học tập!
-- Mod Tin Học 10 DapAnHay
Vào năm nào Việt Nam đã ban hành Bộ mã kí tự Tiếng Việt 16-bit?
Có bao nhiêu kiểu dữ liệu thường gặp?
Tập truyện tranh quen thuộc với nhiều bạn nhỏ “Đô - rê - mon” cho em dạng thông tin gì?
Để ca ngợi đất nước Việt Nam tươi đẹp ta có thể làm những hoạt động nào sau đây?
Theo em, mùi vị của món ăn ngon mẹ nấu cho em ăn là thông tin dạng nào?
Biểu diễn thông tin có vai trò như thế nào?
Bảng mã Unicode ra đời vào năm bao nhiêu?
Bảng mã ASCII mở rộng sử dụng bao nhiêu bit để biểu diễn một kí tự?
Văn bản, số, hình ảnh, âm thanh, phim ảnh trong máy tính được gọi chung là gì?
Bảng mã ASCII mở rộng có bao nhiêu ký tự?
Thông tin đưa vào máy tính dưới dạng dãy bit. Như vậy khi đưa vào máy tính, phải mã hoá thông tin thành dữ liệu nhị phân. Tuỳ theo bản chất của thông tin được mã hoá mà dữ liệu tương ứng có các cách biểu diễn riêng, từ đó hình thành nên các kiểu dữ liệu khác nhau. Vậy trong máy tính có các kiểu dữ liệu nào?
Hình 3.1 minh hoạ một thẻ căn cước công dân. Trên đó có những thông tin gi? Hãy chia những thông tin đó thành các nhóm, ví dụ nhóm các thông tin có thể tách ghép được hay so sánh được để tìm kiếm và nhóm các thông tin có thể thực hiện được với các phép tính số học.
1. Theo em số căn cước công dân có kiểu số hay kiểu văn bản?
2. Kiểu số thực thường dùng để biểu diễn các số có phần thập phân (phần lẻ). Em hãy cho ví dụ một loại hồ sơ có dữ liệu kiểu số thực?
1. Bảng chữ cái tiếng Anh có những kí tự nào?
2. Trong tin học, mỗi nguyên âm có dấu thanh của tiếng Việt là một kí tự. Hãy kể tên các kí tự tiếng Việt có trong bảng chữ cái tiếng Anh. Có bao nhiêu kí tự như vậy?
1. Sử dụng phụ lục bảng mã ASCII mở rộng trang 165, hãy xác định mã nhị phân và mã thập phân của các kí tự S, G, K
2. Trong bảng mã UNICODE, mỗi kí tự Tiếng Việt theo UTF-8 được biểu diễn bởi bao nhiêu byte?
A. 1 byte
B. 2 byte
C. 4 byte
D. từ 1 đến 3 byte
1. Giấy phép lái xe có các thông tin nêu ở cột bên trái của bảng sau. Hãy ghép thông tin ở cột bên trái với kiểu dữ liệu thích hợp ở cột bên phải.
2. Câu trả lời đúng cho câu hỏi “Tại sao cần xây dựng bảng mã Unicode?”
A. Để đảm bảo bình đẳng cho mọi quốc gia trong ứng dụng tin học.
B. Bảng mã ASCII mã hoá mỗi kí tự bởi 1 byte. Giá thành thiết bị lưu trữ ngày càng rẻ nên không cần phải sử dụng các bộ kí tự mã hoá bởi 1 byte
C. Dùng một bảng mã chung cho mọi quốc gia, giải quyết vấn đề thiếu vị trí cho bộ kí tự của một số quốc gia, đáp ứng nhu cầu dùng nhiều ngôn ngữ đồng thời trong cùng một ứng dụng.
D. Dùng cho các quốc gia sử dụng chữ tượng hình.
1. Dựa trên bảng mã ASCII, Việt Nam xây dựng bảng mã VSCII (Vietnamese Standard Code for Information Interchange), còn gọi là TCVN 5712: 1993. Hãy tìm hiểu bảng mã này trên Internet theo những gợi ý sau:
- Bảng mã có đủ cho tất cả các kí tự tiếng Việt không?
- Bảng mã có bảo toàn bảng mã ASCII 7 bit không?
2. Phông chữ là hình ảnh của kí tự ứng với mã của kí tự. Không phải phông chữ nào cũng được thiết kế đầy đủ cho tiếng Việt. Hãy sử dụng phần mềm soạn thảo gõ một câu tiếng Việt và định dạng với các phông chữ khác nhau để tìm hiểu ngoài phông Times New Roman còn những phông nào đã thiết kế cho tiếng Việt Unicode.
Họ và tên
Tiêu đề câu hỏi
Nội dung câu hỏi
0 Bình luận
Để lại bình luận
Địa chỉ email của hạn sẽ không được công bố. Các trường bắt buộc được đánh dấu *