Khoa học dữ liệu và trí tuệ nhân tạo là gì

Giảng viên và sinh viên Khoa Kỹ thuật TTU - Ảnh: Đ.T.

Hiện nay, công nghệ thông tin nói chung, khoa học dữ liệu và trí tuệ nhân tạo nói riêng đều không thể thiếu cho nhu cầu phát triển của xã hội trong thời đại cách mạng công nghiệp 4.0. Chúng đã và đang được ứng dụng trong nhiều mặt của đời sống, từ công nghệ đến y tế, từ cuộc sống hàng ngày đến những chiến lược kinh doanh tỉ đô la Mỹ. Đó là những lĩnh vực "hái ra tiền".

Nhu cầu nhân lực cao, thu nhập không giới hạn

Theo tiến sĩ Cao Tiến Dũng - phó trưởng Khoa Kỹ thuật Trường ĐH Tân Tạo (TTU), khoa học dữ liệu là một lĩnh vực liên ngành về các quá trình và các hệ thống rút trích dữ liệu hoặc hiểu biết từ dữ liệu ở các dạng khác nhau, kể cả ở dạng cấu trúc hay phi cấu trúc; là sự tiếp nối của một số lĩnh vực phân tích dữ liệu như khoa học thống kê, khai phá dữ liệu và máy học...

Các tập đoàn lớn như Facebook, Lazada, Tiki, Uber, Grab phát triển rất mạnh trên cái căn bản chính là chú trọng ứng dụng khoa học dữ liệu. Mở rộng câu chuyện, bất kỳ một công ty, một doanh nghiệp nào cũng luôn cần đội ngũ phân tích dữ liệu, phân tích nhu cầu thị hiếu từ đối tượng kinh doanh để tăng lợi nhuận, hay nói cách khác khai thác dữ liệu để làm ra tiền, mang tiền về.

Từ đó, ông Dũng cho rằng: "Đó là lý do một số trường đại học quốc tế và Việt Nam mở ngành đào tạo này, trong đó có TTU. Khi mọi lĩnh vực được số hóa và công nghệ thay thế con người, sinh viên học ngành này được trải nghiệm ngành học mang tính ứng dụng cao, xã hội đang rất cần nhân lực và thu nhập không giới hạn".

Chia sẻ thêm về ngành đào tạo mới mẻ này, ông Dũng cho biết một sinh viên ngành khoa học dữ liệu có kiến thức khá đa dạng: từ toán thống kê, lập trình, học máy tính hay trí tuệ nhân tạo cho đến kiến thức chuyên ngành ứng dụng.

Trong khi đó, thị trường lao động hiện tại thì lại rất cần đội ngũ nhân lực có các kiến thức này. Từ các công ty công nghệ đến các công ty về thương mại điện tử, quảng cáo, ngân hàng, bảo hiểm, kho vận (logistics),...

Bất kỳ công ty nào cũng cần đội ngũ phân tích dữ liệu, phân tích nhu cầu thị hiếu từ đối tượng kinh doanh để tăng lợi nhuận, hay nói cách khác khai thác dữ liệu để làm ra tiền, mang tiền về.

Tiến sĩ Cao Tiến Dũng

Hiện Khoa Kỹ thuật của trường có 2 ngành: Khoa học máy tính và Kỹ thuật điện. Trong đó ngành Khoa học máy tính có 2 định hướng chuyên sâu là Khoa học dữ liệu và Trí tuệ nhân tạo.

Là người nhiều năm tham gia giảng dạy tại khoa này, tiến sĩ Trần Duy Hiến cho biết học tại TTU, sinh viên đã có khả năng tiếng Anh rất tốt sau khi ra trường. Hiện tại đã có một số cựu sinh viên của khoa đang làm nghiên cứu sinh tại Nhật Bản, Hàn Quốc…

Làm được chứ không phải học tốt

Với ngành đào tạo mới mẻ, đòi hỏi những chuyên gia hàng đầu về lĩnh vực, những giảng viên có chuyên môn cao đảm trách giảng dạy. Theo ông Dũng, 100% giảng viên của khoa đều có bằng tiến sĩ ở các nước phát triển như Mỹ, Pháp, Đức, Ý, Canada…

Từ năm học 2019 - 2020, khoa đã kết hợp hình thức mời một số chuyên gia từ nước ngoài để dạy online cho sinh viên thông qua hệ thống họp trực tuyến.

Điều này giúp sinh viên được học trực tiếp với các chuyên gia hàng đầu thế giới, có cơ hội tiếp cận các chuyên gia, giúp dễ dàng xin các khóa thực tập ở nước ngoài hoặc học bổng để học lên cao sau này.

Tiến sĩ Cao Tiến Dũng - phó trưởng khoa Kỹ thuật cùng sinh viên Hồ Thiên Lạc tham gia hội nghị quốc tế tại Hà Nội - Ảnh: Đ.Th

Chương trình giảng dạy hoàn toàn bằng tiếng Anh cũng là lợi thế không nhỏ trong việc nâng cao năng lực ngoại ngữ cũng như làm việc và học tập trong môi trường quốc tế sau này.

Theo tiến sĩ Trần Duy Hiến - giảng viên của khoa - tỉ lệ sinh viên/giảng viên tương đối thấp nên các thầy cố vấn học tập theo dõi sâu sát năng lực cũng như sự tiến bộ của từng sinh viên, từ đó định hướng cụ thể ngành nghề chuyên sâu sau này một cách phù hợp nhất với khả năng của mỗi người.

Cũng theo ông Hiến, đối với những sinh viên có tư chất và mong muốn học sau đại học ở nước ngoài, các giảng viên tại khoa với các mối quan hệ sâu rộng với các trường đại học tiên tiến trên thế giới, luôn sẵn lòng giới thiệu và tạo mọi điều kiện thuận lợi cho các bạn.

Đánh giá về những giá trị khác biệt của khoa, ông Dũng nhấn mạnh, giá trị cốt lõi cho thành công của người học là giáo dục khai phóng, đẩy mạnh khả năng tự học - tư duy học suốt đời của sinh viên.

Việc đa dạng hóa nguồn giảng viên (thông qua hình thức mời hợp tác dạy online từ xa) giúp sinh viên tự khám phá ra sở thích và năng lực của mình để học và xác định con đường cho bản thân.

"Yêu cầu đối với sinh viên của khoa là: Làm được chứ không phải là học tốt. Khoa tạo cơ hội cho sinh viên thể hiện mình trước doanh nghiệp và chuyên gia thông qua các khóa thực tập, mời chuyên gia dạy từ xa" - ông Dũng nói thêm.

Như vậy, với một ngành học có sức hút lớn, học hoàn toàn bằng tiếng Anh với những giáo sư, tiến sĩ được đào tạo từ các nước phát triển, chương trình đào tạo linh động, sinh viên tốt nghiệp các ngành kỹ thuật máy tính, điện điện tử của TTU có thuận lợi rất lớn khi tiếp tục theo học cao hơn ở nước ngoài, làm việc trong môi trường quốc tế đầy cạnh tranh nhưng cũng nhiều tiềm năng và cơ hội phát triển.

Học với giảng viên nước ngoài là cơ hội tốt

Hồ Thiên Lạc là sinh viên ngành khoa học máy tính - định hướng trí tuệ nhân tạo của TTU. Nói về quá trình học, Lạc cho biết "các thầy hướng dẫn học tập nhiệt tình, luôn trả lời tin nhắn hỏi bài mọi lúc mọi nơi.

Bên cạnh đó, sinh viên được học online với các thầy ở nước ngoài như Singapore hay Canada giúp sinh viên mở rộng kiến thức cũng như nâng cao khả năng tiếng Anh. Trường cũng hỗ trợ học miễn phí các khóa học online trên Datacamp và Coursera.

Một trong những cơ hội đáng kể đó là sinh viên có cơ hội tham gia các hội nghị, hội thảo về kỹ thuật và trí tuệ nhân tạo tại Hà Nội cũng như TP.HCM. Ngoài ra sinh viên cũng được tham gia Trường hè Quốc tế do Viện Toán học Việt Nam tổ chức.

ĐỨC PHONG

Data Science và AI (Trí tuệ nhân tạo – Artificial Intelligence) là hai công nghệ quan trọng nhất trên thế giới hiện nay.

Mặc dù Khoa học dữ liệu sử dụng Trí tuệ nhân tạo trong các hoạt động của mình nhưng chắc chắn không bao hàm AI. Bài viết này sẽ mang đến góc nhìn bao quát về khái niệm Data Science và AI.

Qua đó, bài viết sẽ mang đến hiểu biết sơ bộ về cách các nhà nghiên cứu trên khắp thế giới đang phát triển AI hiện đại.

Data Science và AI (Trí tuệ nhân tạo – Artificial Intelligence) thường bị đánh tráo khái niệm. Mặc dù Khoa học dữ liệu có thể đóng góp vào một số khía cạnh của AI nhưng lại không phản ảnh tất cả về AI.

Trong khi Khoa học dữ liệu đã trở nên phổ biến trên toàn cầu, Trí tuệ nhân tạo vẫn còn khá mơ hồ với nhiều người, thậm chí còn bị nhầm lẫn khái niệm với Khoa học dữ liệu. Để phân biệt chính xác hai khái niệm về công nghệ này, hãy cùng tham khảo bài viết nhé!

Định nghĩa AI (Trí tuệ nhân tạo – Artificial Intelligence) là gì?

AI (Trí tuệ nhân tạo) là “trí thông minh”, hay khả năng tư duy theo lập trình của một khối máy móc. Nó được mô phỏng theo mô hình tư duy của con người hay động vật nói chung.

Trí tuệ nhân tạo biến các thuật toán thành chuỗi hành động trong môi trường thực tế do máy móc thao tác. Những thao tác có chủ đích được máy móc lập đi lập lại chuẩn xác và tỷ lệ thành công cao.

Nhiều thuật toán AI truyền thống được dùng cho mục tiêu rõ ràng và khá đơn giản ví dụ như thuật toán tìm đường dẫn như A*. Với sự phát triển và đòi hỏi cao về công nghệ, các thuật toán AI hiện đại như Deep Learning (một trong những kĩ thuật của Machine Learning) và Word Embedding (một nhóm các kỹ thuật đặc biệt trong xử lý ngôn ngữ tự nhiên) ra đời để phục vụ cho yêu cầu phức tạp hơn.

Ngoài ra, AI cũng sử dụng cho một số kỹ thuật phần mềm chủ chốt để trở thành giải pháp cho các vấn đề sản xuất hiện tại.

Gần đây, nhiều “gã khổng lồ” về công nghệ như Google, Amazon và Facebook đang sử dụng AI (Trí tuệ nhân tạo) nâng cao để phát triển các hệ thống tự động hóa của mình. Ví dụ nổi tiếng nhất là AlphaGo của Google.

Chương trình chơi cờ vây bằng AI này đã đánh bại Ke Jie, một tuyển thủ cờ vây AlphaGo số 1 thế giới. AlphaGo đã sử dụng Mạng nơ-ron nhân tạo được mô phỏng theo các nơ-ron con người tìm hiểu thông tin theo thời gian và thực hiện các hành động.

Mô tả tương quan Data Science và AI

Một vài điểm khác biệt rất cơ bản giữa Data Science và AI giúp chúng hình dung rõ hơn về 2 khía cạnh này, cùng với cơ chế hình thành – hoạt động của nó.

So sánh Data Science và AI qua 4 khía cạnh khác

  • Những giới hạn bắt buộc của AI

Data Science và AI thường bị nhầm lẫn, tuy nhiên, bạn hoàn toàn có thể phân biệt 2 khái niệm này qua những yếu tố bắt buộc phải có trong AI. AI đương đại được sử dụng trên thế giới ngày nay là “Narrow AI”.

Bằng cách nhận diện hình ảnh, phân loại trên hệ thống dữ liệu, hệ thống máy tính có quyền điều khiển nhất định nhưng không giống cơ chế ý thức của con người hoàn toàn.

Thay vào đó, máy móc chỉ thực hiện thao tác đã được lập trình. Ví dụ, AlphaGo có thể đánh bại nhà vô địch cờ vây số 1 thế giới nhưng nó hoàn toàn không có chiến lược để thắng, chỉ đơn giản nó đã được lập trình để chơi game cờ vây này thôi.

  • Data Science là một khái niệm mang tính toàn diện

Data Science (Khoa học dữ liệu) là phân tích và nghiên cứu dữ liệu. Một nhà khoa học dữ liệu chịu trách nhiệm đưa ra quyết định có lợi cho các công ty. Hơn nữa, vai trò của nhà khoa học dữ liệu thay đổi theo ngành công nghiệp.

Trong các vai trò và trách nhiệm hàng ngày của một nhà khoa học dữ liệu, yêu cầu chính là xử lý trước dữ liệu, nghĩa là thực hiện việc lọc và chuyển đổi dữ liệu.

Sau đó, ông phân tích các mẫu trong dữ liệu và sử dụng các kỹ thuật trực quan để vẽ các biểu đồ gạch chân các quy trình phân tích. Sau đó, ông phát triển các mô hình dự đoán khả năng xảy ra các sự kiện trong tương lai.

  • AI là một trong các công cụ cho Data Scientist

Đối với một Data Scientist, AI là một công cụ hay phương pháp phân tích dữ liệu ban đầu để đạt kết quả mong muốn. Áp dụng mô hình Tháp nhu cầu Maslow, mỗi phần của tháp đại diện cho một hoạt động dữ liệu được thực hiện bởi Data Scientist.

Tháp nhu cầu phát triển Data Science và AI theo kiếu Maslow

Mỗi doanh nghiệp sẽ đánh giá tầm quan trọng, cũng như tỷ trọng sử dụng Data Science và AI khác nhau. Ví dụ, một số công ty yêu cầu các vị trí chuyên viên AI thuần túy như Deep Learning Scientist, Machine Learning Engineering, NLP Scientist, v.v… để phục vụ công đoạn sản xuất sản phẩm.

Ở các vị trí này, nhà tuyển dụng được yêu cầu dùng các công cụ Khoa học dữ liệu như R và Python dùng để thực hiện các hoạt động liên quan đến dữ liệu khác nhau nhưng cũng yêu cầu chuyên môn về khoa học máy tính.

Mặt khác, một Data Scientist sẽ giúp doanh nghiệp đưa ra quyết định dựa trên dữ liệu sẵn có. Họ có trách nhiệm trích xuất dữ liệu bằng các truy vấn SQL và NoQuery, giải quyết các bất thường khác nhau trong dữ liệu, phân tích các mẫu trong dữ liệu và áp dụng các mô hình dự đoán để tạo ra những hiểu biết trong tương lai.

Hơn nữa, dựa trên các yêu cầu, Data Scientist cũng sử dụng các công cụ AI như thuật toán Deep Learning thực hiện phân loại và dự đoán chính xác bằng dữ liệu.

Kết luận

  • Data Science là một quá trình bao quát từ giai đoạn tiền xử lý, phân tích, trực quan hóa và dự đoán. Mặt khác, AI đòi hỏi ứng dụng một mô hình dự đoán để dự báo tương lai.
  • Data Science bao gồm các kỹ thuật thống kê khác nhau trong khi AI sử dụng thuật toán máy tính.
  • Các công cụ liên quan đến Data Science nhiều hơn AI. Nguyên nhân bắt nguồn từ Data Science đòi hỏi phân tích dữ liệu qua nhiều bước hơn.
  • Data Science là về việc tìm ra các tập hợp bên trong dữ liệu. AI là về việc truyền quyền tự chủ cho mô hình dữ liệu.
  • Với Data Science, chúng ta sẽ xây dựng các mô hình khai thác thông tin qua thống kê. Mặt khác, AI ra đời trên nền tảng mô phỏng nhận thức và tư duy của con người.
  • Data Science không đề cập đến mức độ xử lý và phản ứng với thông tin cao so với AI.

Tóm lại, AI (Trí tuệ nhân tạo) là vùng đất rộng lớn chứa nhiều điều cần khám phá. Trong khi đó, Data Science là một lĩnh vực sử dụng AI để tạo dự đoán nhưng cũng tập trung vào việc chuyển đổi dữ liệu để phân tích và trực quan hóa.

Mặc dù Data Science là công việc thực hiện phân tích dữ liệu, AI vẫn là một công cụ cần thiết để tạo ra các sản phẩm tốt hơn và truyền đạt chúng bằng cách thao tác được mã hóa tự động.

Nguồn: Data Flair

Cập nhật kiến thức mới

Nhập email để cập nhật nhanh nhất thông tin, kiến thức từ Viện ISB

Video liên quan

Chủ đề