EVNNPT tổ chức đào tạo chuyên sâu về máy học và phân tích dữ liệu lớn

Thứ tư, 16/12/2020 | 16:00 GMT+7
Trong 5 ngày từ 23 đến ngày 27/11/2020, Tổng công ty Truyền tải điện Quốc gia (EVNNPT) đã tổ chức khóa đào tạo phổ biến kiến thức về Bigdata và Machine Learning. Tham gia khóa đào tạo có Ban Viễn thông và Công nghệ thông tin EVNNPT, các cán bộ kỹ thuật và viễn thông công nghệ thông tin của EVNNPT.

Phát biểu khai mạc khóa đào tạo, ông Đoàn Thanh Tùng - Trưởng Ban VTCNTT EVNNPT chia sẻ mục tiêu chiến lược và các định hướng ứng dụng công nghệ mới của EVNNPT, vai trò của dữ liệu trong trợ giúp quyết định các lĩnh vực quản lý, vận hành, đầu tư xây dựng.

Phát biểu tại buổi khai mạc, Tiến sĩ Nguyễn Văn Hậu - Đại học Sư phạm Kỹ thuật Hưng Yên giới thiệu sơ bộ về Trung tâm, kinh nghiệm bản thân và các trợ giảng, mong muốn đưa được sự am hiểu nhất quán về Machine Learning với các khía cạnh khái niệm, vai trò, ứng dụng, phương pháp triển khai… đến học viên.

TS. Nguyễn Văn Hậu trình bày kiến thức cơ bản về Machine Learning

Trong ngày đầu tiên, Tiến sĩ Nguyễn Văn Hậu đã trao đổi với học viên về những kiến thức tổng quan về AI và ML. Cụ thể bài giảng tập trung trả lời các câu hỏi sau:

- AI và ML là gì (WHAT)?

- AI và ML có thể được áp dụng trong những bài toán nào?

- Điều kiện và khi nào (WHEN) có thể áp dụng được AI và ML?

- Áp dụng AI và ML như thế nào (HOW)?

Trong buổi chiều, Tiến sĩ Nguyễn Văn Hậu cung cấp kiến thức nền tảng về ngôn ngữ Python - ngôn ngữ áp dụng phổ biến hiện nay cho ML và thực hành với bài toán dùng thuật toán K-nearest neighbor (KNN) để dự đoán thời gian phân phát đồ ăn nhanh tại các cửa hàng.

TS. Phạm Minh Chuẩn trình bày phương pháp xây dựng ứng dụng dự đoán bẳng thuật toán Gradient - Descent

Sáng ngày 24/11, các học viên đã tìm hiểu sự biến thiên của hàm số, các phương pháp tìm cực trị và ứng dụng của nó trong bài toán dự toán và tối ưu. Phân tích bài toán dự đoán về nhu cầu sử dụng điện với cách tiếp cận bình phương cực tiểu. Tiếp đến, một phương pháp khá phổ biến được giới thiệu để giải giải quyết bài toán một cách dễ dàng hơn, đó là Gradient Descent.

Trong buổi chiều, các học viên được thực hành cài đặt bài toán với ngôn ngữ Python trên công cụ Google Colab. Thông qua bài học này, học viên hoàn toàn có thể tự xây dựng chương trình dự đoán cho bài toán trong thực tế.

TS. Nguyễn Minh Tiến trình bày thuật toán Naive Bayes và phương pháp ứng dụng trong việc phân loại lỗi thiết bị dựa trên dữ liệu đo hàm lượng khí trong dầu

Naive Bayes là một thuật toán đơn giản nhưng mạnh mẽ đáng ngạc nhiên cho mô hình dự đoán phân loại nhị phân (hai lớp) và đa lớp dựa trên xác suất.

Trong ngày 25/11, các học viên đã thảo luận về bài toán dự đoán lỗi thiết bị và giới thiệu các phương pháp học máy cơ bản để giải quyết bài toán dự đoán lỗi thiết bị. Thực hành các mô hình học máy để phân loại lỗi thiết bị máy biến áp (dữ liệu mẫu DGA) và một số dạng dữ liệu thực tế khác như văn bản.

TS. Vũ Huy Thế trình bày phương pháp ứng dụng phân cụm trạng thái vận hành bằng thuật toán K-means

Phân cụm K-means là 1 phương pháp lượng tử hóa vector dùng để phân các điểm dữ liệu cho trước vào các cụm khác nhau. Phân cụm K-means có nhiều ứng dụng, nhưng được sử dụng nhiều nhất trong Trí tuệ nhân tạo và Học máy không có giám sát.

Trong ngày 26/11, các học viên tìm hiểu bài toàn phân nhóm dữ liệu và thực hành xây dựng ứng dụng phân nhóm trạng thái máy biến áp dựa trên dữ liệu giám sát dầu online. Đây là ứng dụng dựa trên bộ dữ liệu lịch sử về hàm lượng khí hoà tan trong dầu. Dựa trên việc phân cụm để tìm ra được mối quan hệ của các thành phần khí hoà tan trong những trạng thái hoạt động (lỗi) của máy biến áp. Từ đó, ta có thể có những phương pháp quản lý và giám sát hoạt động máy biến áp hiệu quả hơn.

TS. Nguyễn Văn Quyết trình bày tổng quan về Big Data và hướng dẫn thực hành lưu trữ, khai thác dữ liệu trong môi trường phân tán bằng Hadoop

Ngày cuối cùng của khóa học, các học viên được tiếp cận các khái niệm, đặc trưng, các lĩnh vực ứng dụng về của Big Data; các nền tảng/công cụ được sử dụng trong từng bước xử lý dữ liệu lớn: Hadoop, Spark, Kafka, Flume, Sqoop, Hive, Hbase; mô hình lập trình song song phân tán với MapReduce thông qua các ví dụ thực tế.

Thảo luận về bài toán khai phá dữ liệu (data mining) với thuật toán Apriori, ứng dụng phân tích hành vi khách hàng. Bài toán khai thác tập phổ biến (frequent itemset) là lớp bài toán rất quan trọng trong lĩnh vực khai phá dữ liệu. Mục tiêu của nó là tìm tất cả các tập mẫu, liên kết, tương quan hoặc cấu trúc nhân quả có độ phổ biến cao trong tập hợp tất cả các hạng mục hoặc đối tượng trong cơ sở dữ liệu, ví dụ như phân nhóm các phòng hay có tương tác công việc với nhau để bố trí gần nhau, hoặc phân nhóm các vật tư thường hư hỏng cùng nhau (về thời gian hoặc không gian) để thay đổi chiến lược vật tư dự phòng (số lượng hoặc vị trí lưu kho)…

Trong quá trình đào tạo, các học viên đã trao đổi các ý tưởng ứng dụng Machine Learning trong công việc của đơn vị mình cũng như các đề xuất về chính sách, nguồn lực để hỗ trợ công tác nghiên cứu và phát triển các công nghệ mới./.

Mai Anh Tuấn - Ban VTCNTT
Vận hành

Vận hành

Đầu tư

Đầu tư

Quan hệ quốc tế

Quan hệ quốc tế

Lịch sự kiện

Lịch sự kiện