Dữ liệu – Nguồn Tài nguyên vô tận – Tài sản của kỷ nguyên công nghệ số
Quá trình học hỏi – Kinh nghiệm sống
Trong quá trình sống, học hỏi và
phát triển của mỗi người, hầu hết chúng ta thường áp dụng những kinh nghiệm của
bản thân đã biết để ứng phó với những hoàn cảnh hiện tại đang diễn ra, phần lớn
những kinh nghiệm tích lũy qua năm tháng ít nhiều mang giá trị riêng giúp chúng
ta vượt qua hoàn cảnh, nhưng đôi khi, đứng trước những vấn đề chưa từng xảy ra
trước đó, mỗi người lại tích lũy thêm cho mình những bài học quý giá. Như vậy,
đôi khi những bài học trong quá khứ cũng không còn đúng cho hoàn cảnh hiện tại,
về điều này, có nhiều nguyên nhân, có thể bài học trong quá khứ không phản ánh
đúng bản chất của sự vật hiện tượng, hoặc sự vật hiện tượng đã biến đổi quá nhiều
khiến những bài học cũ trở nên không còn đúng đắn nữa. Những vấn đề này nằm
trong quá trình học hỏi, thích nghi và phát triển của mỗi người, như vậy, mỗi
chúng ta đều không ngừng tích lũy, tiếp thu để có thể thích nghi được với môi
trường hoàn cảnh đang biến đổi không ngừng.
{tocify}$title = {Mục lục bài viết}
Dữ liệu – Sự ghi nhận lại các sự kiện
Vậy thì tất cả những vấn đề này
có liên quan gì đến dữ liệu, đề tài tôi muốn giới thiệu bạn trong bài viết này.
Tôi gửi bạn một vài ví dụ cụ thể để chúng ta có thể hình dung được dữ liệu và
quá trình thích nghi và kinh nghiệm sống thực tế có mối liên hệ với nhau. Từ xa
xưa, để dự báo về tình hình thời tiết, theo kinh nghiệm dân gian, chúng ta được
kế thừa một kho tàng ca dao, tục ngữ, chẳng hạn như: “ Chuồn chuồn bay thấp thì
mưa, bay cao thì nắng, bay vừa thì râm”, “Đêm tháng 5 chưa nằm đã sáng, Ngày
tháng 10 chưa cười đã tối”, “Cơn đằng Đông vừa trông vừa chạy, cơn đằng Nam vừa
làm vừa chơi”, “Rét tháng 3 bà già chết cóng”, “Nhiều sao thì nắng, vắng sao
thì mưa”… Bạn để ý về cấu phần của các câu tục ngữ đều có 2 phần, Nếu điều này
xảy ra Thì điều kia sẽ đến. Những câu ca dao, tục ngữ có thể rất đúng, phản ánh
sự vật hiện tượng có tính quy luật, có thể tương đối đúng, phần lớn thường xảy
ra, hoặc không còn đúng cho đến ngày nay. Khi các hiện tượng chưa được ghi chép
lại, chúng ta chỉ biết rằng hiện tượng đó xuất hiện rất nhiều lần và hầu hết
kéo theo các kiện khác theo sau đó. Vậy thì, nếu các hiện tượng được ghi chép lại
và chúng ta đếm số lần xảy ra sự kiện kéo theo, chúng ta có thể tính được khả
năng xảy ra sự kiện trong một khoảng thời gian, và sự ghi chép này chính là dữ
liệu ghi nhận cho hiện tượng và sự kiện.
Quay lại 1 ví dụ đơn giản về “Đêm
tháng 5 chưa nằm đã sáng, Ngày tháng 10 chưa cười đã tối”, chúng ta ghi nhận thời
điểm trời rạng trong suốt tháng 5, ghi nhận thời điểm trời tối trong suốt tháng
10, trong khoảng thời gian 1 năm, 10 năm, 100 năm, ta thấy rằng tỷ lệ trời sáng
lúc 5h vào tháng 5 khoảng 85%, tỷ lệ trời tối lúc 17h30 vào tháng 10 khoảng 87%, điều này
củng cố thêm độ tin cậy cho câu tục ngữ. Tuy nhiên, nếu phạm vi đo đạc không phải
ở Việt Nam (miền Bắc), mà áp dụng ở một vị trí nào đó ở 2 đầu cực Bắc hoặc cự
Nam của Trái đất, có lẽ điều này không còn đúng.
Dữ liệu – Một dạng tài nguyên mới
Như vậy, việc thu thập dữ liệu để
đo lường, định lượng một sự vật, hiện tượng, sự kiện, giúp chúng ta đánh giá chất
lượng của kinh nghiệm, độ tin cậy, tính hiệu quả và có thể đem lại giá trị
trong việc ứng dụng kinh nghiệm trong 1 phạm vi cụ thể. Điều này không giúp
chúng ta khẳng định một quy luật bất biến nào đó (chẳng hạn như Trái đất quay
quanh chính mình trong 24h, Trái đất quay quanh mặt trời 365 ngày), thực tế,
thu thập dữ liệu xảy ra sự kiện giúp chúng ta đánh giá được khả năng (có thể có
hoặc không) xảy ra một sự kiện kéo theo).
Trong thời đại số hóa ngày nay, dữ
liệu đã trở thành một loại tài nguyên quý báu của xã hội, cứ mỗi giây trôi qua
chúng ta ghi nhận thêm hàng triệu Gigabyte(GB) dữ liệu mới được sinh ra trên
toàn cầu từ các nguồn khác nhau như website, các mạng xã hội, các thiết bị kỹ
thuật, các hệ thống lưu trữ thông tin khác...Dữ liệu vừa được xem là nguyên liệu,
vừa được xem là tài sản tùy vào các cấp độ khai thác đang đem lại nhiều tri thức
hơn cho chúng ta ở tất các các hoạt động sống, tất cả các lĩnh vực kinh tế xã hội,
khoa học và đời sống.
Trong sự phát triển của công nghệ
ngày này, chúng ta đã dần quen thuộc với các lĩnh vực như tự động hóa, trí
thông minh nhân tạo, học máy... tất cả những lĩnh vực đều được phát triển từ
quá trình phân tích dữ liệu và các mô hình toán học. Các mô hình học máy cần được
đào tạo dựa trên tập dữ liệu lớn để có thể áp dụng trong điều kiện thực tế đời
sống. Chẳng hạn, một chiếc xe tự hành ngày nay trước khi được vận hành trên đường,
cần thiết phải trải qua quá trình huấn luyện đủ lớn, trong nhiều tháng hoặc thậm
chí nhiều năm, trong hàng triệu kịch bản dữ liệu giao thông khác nhau, điều này
giúp cải thiện tính chính xác, mức độ an toàn và ứng phó trước những tình huống
giao thông thực tế.
Khai thác dữ liệu – Gia tăng giá trị tài sản và tri thức cho nhân loại
Việc khai thác dữ liệu thực tế
giúp chúng ta khám phá thêm nhiều mối liên hệ và tương quan khác nhau giữa các
dữ liệu, nhóm dữ liệu, khai thác dữ liệu giúp gia tăng thêm đa dạng kinh nghiệm
mới, tri thức mới, các ứng dụng mới dựa trên lợi ích của thu thập dữ liệu và
ghi chép lại các sự kiện, hiện tượng.
Tăng cường hiểu biết và kiến thức:
Dữ liệu lớn cung cấp thông tin từ đa dạng các nguồn khác nhau, quá trình khai
thác dữ liệu giúp chúng ta củng cố tri thức cũ, gia tăng trí thức mới, mở rộng
hiểu biết cho mọi lĩnh vực của đời sống, và mối liên hệ mới giữa các lĩnh vực.
Cải thiện chất lượng phân tích,
ra quyết định và dự đoán: Phân tích dữ liệu lớn giúp chúng ta đưa ra quyết định
tốt hơn, chính xác hơn và tin cậy hơn, tạo lợi thế cạnh tranh từ lợi ích khai thác
dữ liệu, giúp giảm chi phí cơ hội và nâng cao hiệu quả hoạt động trong đời sống
kinh tế, xã hội.
Nâng cao chất lượng của sản phẩm,
trải nghiệm: Khai thác dữ liệu hành vi, chúng ta hiểu hơn về nhu cầu và mong muốn
của con người, từ đó đáp ứng tốt hơn về chất lượng dịch vụ về sản phẩm và trải
nghiệm trong đời sống.
Dữ liệu có thể được coi là một loại
tài nguyên vô tận vì nó có thể được sao chép, chia sẻ, và tái sử dụng mà không
làm giảm đi lượng dữ liệu gốc. Nguồn tài nguyên này liên tục gia tăng từ quá
trình ghi nhận sự kiện, hiện tượng trong mọi hoạt động sống, các dữ liệu được
làm sạch, chuẩn hóa, hoặc là kết quả phân tích, dự báo của các dữ liệu khác.
Dữ liệu thực tế đóng vai trò hết sức quan trọng trong mọi khía cạnh của đời sống ngày nay, từ kinh doanh đến y tế, từ giáo dục đến chính trị...Việc hiểu biết và vận dụng tối đa tiềm năng của dữ liệu là chìa khóa để phát triển, gia tăng giá trị tài sản và tri thức cho nhân loại.
0 Comments