Hướng dẫn SSIS cho người mới bắt đầu: Tại sao, Cái gì và Bằng cách nào?



SSIS là một nền tảng cho các ứng dụng tích hợp dữ liệu và quy trình làm việc. Hướng dẫn SSIS này trình bày lý do tại sao, cái gì và cách thức của Dịch vụ Tích hợp Máy chủ SQL.

Dịch vụ Tích hợp Máy chủ SQL (SSIS) là một phần không thể thiếu của phần mềm Cơ sở dữ liệu Microsoft SQL Server. Điều này làm cho công việc quản lý dữ liệu dễ dàng hơn rất nhiều với các tính năng khác nhau của nó. Trong hướng dẫn này, chúng ta sẽ tìm hiểu sâu hơn về SSIS ở cấp độ khái niệm, theo thứ tự sau:

Bắt đầu nào.





Tích hợp dữ liệu là gì?

Tích hợp dữ liệu là một quá trình trong đó dữ liệu không đồng nhất được truy xuất và kết hợp như một hình thức và cấu trúc hợp nhất. Ví dụ, mọi công ty ngày nay đều phải xử lý một lượng lớn dữ liệu từ nhiều nguồn khác nhau. Dữ liệu này cần được xử lý để cung cấp thông tin sâu sắc cho việc đưa ra các quyết định kinh doanh. Vì vậy, một giải pháp đơn giản sẽ là Tích hợp dữ liệu. Về cơ bản, nó sẽ tích hợp tất cả dữ liệu của bạn có trong các cơ sở dữ liệu khác nhau và kết hợp chúng trên cùng một nền tảng.

Dưới đây là một số cách để đạt được Tích hợp dữ liệu:



Tích hợp dữ liệu-Hướng dẫn SSIS- Edureka

Bây giờ bạn đã hiểu về tích hợp dữ liệu, hãy xem tại sao SSIS được sử dụng. SSIS là viết tắt của Dịch vụ tích hợp máy chủ SQL .

Tại sao SSIS?



quản lý phiên trong ứng dụng web java
  • Dữ liệu có thể được tải song song đến nhiều đích khác nhau
  • SSIS loại bỏ nhu cầu của các lập trình viên chuyên nghiệp
  • Tích hợp chặt chẽ với các sản phẩm khác của Microsoft
  • SSIS rẻ hơn hầu hết các Công cụ ETL khác
  • SIS cung cấp GUI để chuyển đổi dữ liệu dễ dàng
  • Xây dựng BI thành một quá trình chuyển đổi dữ liệu
  • Xử lý lỗi và sự kiện mạnh mẽ

Tiếp tục trong Hướng dẫn SSIS này, hãy xem chính xác nó là gì và nó hoạt động như thế nào.

SSIS là gì?

SQL Server Integration Services (SSIS) là một thành phần của phần mềm cơ sở dữ liệu Microsoft SQL Server có thể được sử dụng để thực hiện một loạt các tác vụ tích hợp dữ liệu và chuyển đổi dữ liệu.

  • Tích hợp dữ liệu: Nó kết hợp dữ liệu ở các nguồn khác nhau và cung cấp cho người dùng cái nhìn thống nhất về những dữ liệu này
  • Quy trình làm việc: Nó cũng có thể được sử dụng để tự động bảo trì cơ sở dữ liệu SQL Server và cập nhật dữ liệu phân tích đa chiều

Các tính năng của SSIS

Một số tính năng để sử dụng SSIS là:

  • Các phép biến đổi có tổ chức và tra cứu
  • Tích hợp chặt chẽ với họ Microsoft SQL khác
  • Cung cấp Môi trường Studio phong phú
  • Cung cấp nhiều chức năng tích hợp dữ liệu để chuyển đổi tốt hơn
  • Kết nối dữ liệu tốc độ cao

Bạn có thể xem qua video dưới đây bao gồm tất cả các khái niệm cơ bản bao gồm các khái niệm về kho dữ liệu được sử dụng để trích xuất, chuyển đổi và tải dữ liệu (ETL). Nó lý tưởng cho cả người mới bắt đầu và những người chuyên nghiệp muốn tìm hiểu những kiến ​​thức cơ bản về MSBI.

Tiếp tục trong phần hướng dẫn SSIS, hãy xem cách hoạt động chính xác của nó.

SSIS hoạt động như thế nào?

SSIS bao gồm ba thành phần chính, đó là:

  • Dữ liệu hoạt động
  • Quy trình ETL
  • Kho dữ liệu

Các tác vụ chuyển đổi dữ liệu và tạo quy trình làm việc này được thực hiện bằng cách sử dụng ‘Gói SSIS’, sẽ được thảo luận sau trong blog này. Tiếp tục với hướng dẫn SSIS, trước tiên chúng ta hãy hiểu chi tiết từng thành phần sau:

Dữ liệu hoạt động

Kho dữ liệu hoạt động (ODS) là cơ sở dữ liệu được thiết kế để tích hợp dữ liệu từ nhiều nguồn cho các hoạt động bổ sung trên dữ liệu. Đây là nơi chứa hầu hết dữ liệu được sử dụng trong hoạt động hiện tại trước khi được chuyển vào kho dữ liệu để lưu trữ hoặc lưu trữ lâu dài hơn.

Quy trình ETL

ETL là một quá trình để giải nén, biến đổi và tải dữ liệu. Trích xuất, chuyển đổi và tải (ETL) là quá trình trích xuất dữ liệu từ nhiều nguồn khác nhau, chuyển đổi dữ liệu này để đáp ứng yêu cầu của bạn và sau đó tải vào kho dữ liệu đích. ETL cung cấp GIẢI PHÁP DỪNG LẠI cho tất cả những vấn đề này.

  • Trích xuất
  • Biến đổi
  • Tải

Trích xuất: Trích xuất là quá trình trích xuất dữ liệu từ các nguồn dữ liệu đồng nhất hoặc không đồng nhất khác nhau dựa trên các điểm xác nhận khác nhau.

Chuyển đổi: Trong quá trình chuyển đổi, toàn bộ dữ liệu được phân tích và các chức năng khác nhau được áp dụng trên đó để tải dữ liệu vào cơ sở dữ liệu đích ở định dạng chung và sạch.

Tải: Đang tải là quá trình tải dữ liệu đã xử lý vào kho dữ liệu đích sử dụng tài nguyên tối thiểu.


Kho dữ liệu

  • Kho dữ liệu nắm bắt dữ liệu từ các nguồn khác nhau để phân tích và truy cập hữu ích.
  • Kho dữ liệu là một tập hợp dữ liệu lớn được tích lũy được sử dụng để tập hợp và quản lý dữ liệu từ nhiều nguồn khác nhau nhằm mục đích trả lời các câu hỏi kinh doanh. Do đó, giúp đưa ra quyết định.

Yêu cầu đối với dịch vụ tích hợp máy chủ SQL

Để làm việc với SSIS, bạn phải cài đặt những thứ sau:

  • Máy chủ SQL
  • Công cụ dữ liệu SQL Server

Hãy xem quá trình cài đặt.

Cài đặt máy chủ SQL

Truy cập trang web: https://www.microsoft.com/en-au/sql-server/sql-server-downloads để cài đặt SQL Server. Bạn có thể cài đặt phiên bản mới nhất hoặc phiên bản trước tùy theo sự lựa chọn của bạn.

Vì vậy, có các phiên bản SQL Server khác nhau, cụ thể là:

    • Dùng thử miễn phí: Bạn nhận được bản dùng thử miễn phí 180 ngày của SQL Server 2017 trên Windows.
    • Phiên bản dành cho nhà phát triển: Đây là một phiên bản miễn phí đầy đủ tính năng, được cấp phép để sử dụng làm cơ sở dữ liệu phát triển và thử nghiệm trong môi trường phi sản xuất.
    • Phiên bản Express: Express là phiên bản miễn phí của SQL Server, lý tưởng để phát triển và sản xuất cho các ứng dụng máy tính để bàn, web và máy chủ nhỏ.

Tiếp theo, hãy xem cách cài đặt các công cụ dữ liệu.

Công cụ dữ liệu SQL Server

Truy cập trang web: https://docs.microsoft.com/en-us/sql/ssdt/previous-releases-of-sql-server-data-tools-ssdt-and-ssdt-bi?view=sql-server-ver15 và xem các bản phát hành khác nhau do Microsoft cung cấp. Tham khảo ảnh chụp màn hình bên dưới với bản phát hành SSDT gần đây cùng với liên kết tải xuống.

Trong hướng dẫn này, tôi sẽ cài đặt phiên bản 15.9.1. Hãy bắt đầu.

Bước 1: Khi bạn mở tệp .exe, bạn sẽ được yêu cầu khởi động lại hệ thống trước khi cài đặt.

Bước 2: Khi bạn đã khởi động lại hệ thống của mình, bạn đã sẵn sàng. Chỉ cần nhấp vào nút “Tiếp theo” và làm theo hướng dẫn trên màn hình.

* trong sql là gì

Bước 3: Nó sẽ hiển thị các công cụ cần thiết và các tính năng như Cơ sở dữ liệu SQL Server, SSAS, SSRS và SSIS. Đảm bảo rằng bạn kiểm tra tất cả chúng và nhấp vào nút 'cài đặt'. Tham khảo ảnh chụp màn hình dưới đây cho giống nhau.

Tiếp theo trong Hướng dẫn SSIS, chúng ta sẽ thảo luận về gói SSIS và cách bạn có thể tạo nó bằng các công cụ trên.

Gói SSIS là gì?

Gói là một khối cơ bản nơi bạn tiếp tục và viết mã trong SSIS. Bây giờ “mã” không dùng để chỉ bất kỳ ngôn ngữ lập trình nào, đó là sự phát triển của bạn. Vì vậy, về cơ bản sự phát triển của bạn được thực hiện bên trong một gói. Như đã thảo luận ở trên, SSIS là cần thiết cho ETL và gói SSIS sẽ thực hiện quy trình ETL. Do đó, nó là một đối tượng triển khai chức năng Dịch vụ Tích hợp để trích xuất, chuyển đổi và tải dữ liệu . Một gói bao gồm:

  • Kết nối
  • Kiểm soát các phần tử dòng chảy
  • Các phần tử luồng dữ liệu

Đó là tất cả cho Hướng dẫn SSIS này. Tôi hy vọng bạn đã thích đọc nó.

Điều này đưa chúng ta đến phần cuối của blog này. Tôi hy vọng bạn thích blog hướng dẫn Power BI này. Đây là blog đầu tiên của loạt Power BI. Hướng dẫn Power BI này sẽ được tiếp nối bởi blog tiếp theo của tôi, sẽ tập trung vào Bảng điều khiển Power BI, hãy đọc điều đó.

Nếu bạn muốn tìm hiểu SSIS và xây dựng sự nghiệp trong trực quan hóa dữ liệu hoặc BI, thì hãy xem đi kèm với đào tạo trực tiếp do người hướng dẫn và trải nghiệm dự án thực tế. Khóa đào tạo này sẽ giúp bạn hiểu sâu về MSBI và giúp bạn đạt được thành thạo về chủ đề này.

Có một câu hỏi cho chúng tôi? Vui lòng đề cập đến nó trong phần nhận xét của “Hướng dẫn SSIS” và chúng tôi sẽ liên hệ lại với bạn.