Hướng dẫn về Informatica: Hiểu về Informatica 'Inside Out'



Blog Informatica Tutorial này sẽ giải thích chi tiết Informatica PowerCenter, kiến ​​trúc Informatica và cách tạo miền trong Informatica

Chúng tôi đã học trong blog cuối cùng về và ứng dụng thực tế của nó.Bây giờ chúng ta hãy đi sâu và tìm hiểu trong blog Hướng dẫn Informatica này về Informatica, kiến ​​trúc của nó và một trường hợp sử dụng. là một trong những kỹ năng được quan tâm nhiều nhất trên thị trường ngày nay vì đây là một nền tảng tích hợp dữ liệu độc đáo và không thiên vị, tương tác trên nhiều phạm vi tiêu chuẩn, hệ thống và ứng dụng khác nhau.Như đã thảo luận trong blog trước, Informatica PowerCenter là sản phẩm chủ lực của Informatica và thường được sử dụng thay thế cho nhau. Tóm lại, Informatica Powercenter là một nền tảng tích hợp dữ liệu doanh nghiệp thống nhất, duy nhất cho phép các công ty và tổ chức chính phủ thuộc mọi quy mô truy cập, khám phá và tích hợp dữ liệu từ hầu hết mọi hệ thống kinh doanh, ở bất kỳ định dạng nào và cung cấp dữ liệu đó trong toàn doanh nghiệp ở bất kỳ tốc độ nào . Nó là một công cụ ETL (Trích xuất, Biến đổi và Tải) với ưu điểm chính của nó so với các công cụ ETL khác như sau:

  • Nó mạnh mẽ và có thể được sử dụng trong cả windows và hệ thống dựa trên UNIX
  • Nó có hiệu suất cao nhưng rất đơn giản để phát triển, duy trì và quản lý

Hướng dẫn Informatica: Tìm hiểu Informatica PowerCenter

Để hiểu Informatica real time, chúng ta nên hiểu sâu về Kiến trúc Informatica và các thành phần khác của Informatica. Vì vậy, ở phần cuối của blog Hướng dẫn Informatica này, bạn sẽ có thể hiểu những điều sau:





  1. Kiến trúc Informatica là gì?
    1. Thành phần khách hàng của Informatica
      1. Người quản lý kho lưu trữ Informatica PowerCenter
      2. Informatica PowerCenter Designer
      3. Trình quản lý quy trình làm việc PowerCenter
      4. PowerCenter Workflow Monitor
      5. Quản trị viên bảng điều khiển
    2. Thành phần máy chủ của Informatica
      1. Dịch vụ kho lưu trữ
      2. Dịch vụ tích hợp
      3. Dịch vụ SAP BW
      4. Trung tâm dịch vụ trang web
  2. Luồng dữ liệu trong Informatica
  3. Tên miền và nút Informatica
  4. Giám đốc Dịch vụ & Dịch vụ Informatica
  5. Trường hợp sử dụng: Cách tải bảng kích thước sản phẩm bằng SCD

Kiến trúc Informatica là gì?

Kiến trúc của Informatica PowerCenter dựa trên khái niệm Kiến trúc hướng dịch vụ (SOA). Kiến trúc hướng dịch vụ (SOA) có thể được định nghĩa là một nhóm các dịch vụ giao tiếp với nhau. Quá trình giao tiếp liên quan đến việc truyền dữ liệu đơn giản hoặc nó có thể liên quan đến hai hoặc nhiều dịch vụ phối hợp cùng một hoạt động.

Sự phát triển của Informatica dựa trên các Kỹ thuật Phát triển Dựa trên Thành phần. Phát triển dựa trên thành phần là một kỹ thuật trong đó các thành phần hoặc đơn vị chức năng được xác định trước, hoặc cả hai, với các chức năng cụ thể được sử dụng để lắp ráp sản phẩm cuối cùng. PowerCenter tuân theo phương pháp luận phát triển dựa trên thành phần bằng cách cho phép xây dựng luồng dữ liệu từ nguồn đến đích, sử dụng các thành phần khác nhau (được gọi là các phép biến đổi) và liên kết chúng với nhau theo yêu cầu. Một cách tốt để đi về nó là trước tiên phải hiểu các thành phần của Informatica là gì và sau đó chúng ta sẽ học cách áp dụng Informatica để giải quyết các vấn đề kinh doanh điển hình thông qua một ca sử dụng.



Vì vậy, công cụ Informatica PowerCenter bao gồm 2 thành phần. Họ đang:

  • Thành phần khách hàng
  • Thành phần máy chủ
Informatica-tutorial-Informatica-Architecture

Hình: Tổng quan về kiến ​​trúc Informatica

Các thành phần máy khách của Informatica PowerCenter:

  • Trình quản lý kho lưu trữ PowerCenter:

Quản lý kho lưu trữ được sử dụng để quản lý kho lưu trữ. Nó có thể quản lý người dùng và nhóm. Chúng tôi có thể tạo, xóa và chỉnh sửa người dùng và nhóm người dùng trong kho lưu trữ. Chúng tôi cũng có thể gán và thu hồi các đặc quyền kho lưu trữ và quyền thư mục.



Trình quản lý Kho lưu trữ có các cửa sổ sau:

  • Hoa tiêu: Nó hiển thị tất cả các đối tượng mà bạn tạo trong Trình quản lý Kho lưu trữ, Trình thiết kế và Trình quản lý Dòng công việc. Đầu tiên nó được sắp xếp theo kho lưu trữ và sau đó là theo thư mục.
  • Chủ yếu: Nó cung cấp các thuộc tính của đối tượng được chọn trong Bộ điều hướng. Các cột trong cửa sổ này thay đổi tùy thuộc vào đối tượng được chọn trong Bộ điều hướng.
  • Đầu ra: Nó cung cấp đầu ra của các tác vụ được thực thi trong Trình quản lý kho lưu trữ.

Hình: Người quản lý kho lưu trữ

  • Informatica PowerCenter Designer

PowerCenter Designer là ứng dụng khách nơi chúng tôi chỉ định cách di chuyển dữ liệu giữa các nguồn và mục tiêu khác nhau. Đây là nơi chúng tôi giải thích các yêu cầu kinh doanh khác nhau bằng cách sử dụng các thành phần PowerCenter khác nhau được gọi là phép biến đổi và chuyển dữ liệu qua chúng (phép biến đổi). Trình thiết kế được sử dụng để tạo các định nghĩa nguồn, định nghĩa đích và các phép biến đổi, có thể được sử dụng thêm để phát triển các ánh xạ.

Hình: Informatica PowerCenter Designer

  • Informatica PowerCenter Workflow Manager

    Nó là một tập hợp có thứ tự gồm một hoặc nhiều phiên và các nhiệm vụ khác, được thiết kế để hoàn thành một mục đích hoạt động tổng thể. Nó executes một loạt các Ánh xạ (dưới dạng Phiên) và các tác vụ khác.

Hình: Trình quản lý quy trình làm việc

Trình quản lý Dòng công việc là ứng dụng PowerCenter cho phép các nhà thiết kế xây dựng và chạy Dòng công việc. Nó có thể được mở như sau:

  • Có thể khởi chạy từ Designer bằng cách nhấp vào biểu tượng “W”
  • Có thể mở độc lập từ đường dẫn Start> All Programs> Informatica PowerCenter 9.6.1> Client> PowerCenter Client> PowerCenter Workflow Manager
  • Có thể được mở từ Trình thiết kế quy trình làm việc -Công cụ bạn sử dụng để tạo các đối tượng Quy trình làm việc

Hình: Giao diện trình quản lý quy trình làm việc

Trình quản lý Dòng công việc hiển thị các cửa sổ sau để giúp bạn tạo và tổ chức các dòng công việc:

  • Bạn có thể kết nối và làm việc trong nhiều kho và thư mục. Trong Bộ điều hướng, Trình quản lý Dòng công việc hiển thị biểu tượng màu đỏ trên các đối tượng không hợp lệ.
  • Bạn có thể tạo, chỉnh sửa và xem các tác vụ, quy trình làm việc và bảng tính.
  • Nó chứa các tab để hiển thị các loại thông báo đầu ra khác nhau. Cửa sổ đầu ra chứa các tab sau:
    • Hiển thị thông báo khi bạn lưu một dòng công việc, bảng công việc hoặc nhiệm vụ. Tab Lưu hiển thị tóm tắt xác thực khi bạn lưu một dòng công việc hoặc một bảng tính.
    • Tìm nạp Nhật ký. Hiển thị thông báo khi Trình quản lý dòng công việc tìm nạp các đối tượng từ kho lưu trữ.
    • Hiển thị thông báo khi bạn xác thực một dòng công việc, bảng công việc hoặc nhiệm vụ.
    • Hiển thị thông báo khi bạn sao chép các đối tượng kho lưu trữ.
    • Hiển thị thông báo từ Dịch vụ Tích hợp.
    • Hiển thị thông báo từ Dịch vụ Kho lưu trữ.

Informatica Workflow Designer

Nó ánh xạ thứ tự thực thi và các phụ thuộc của Phiên, Nhiệm vụ và Worklet, cho Máy chủ Informatica

Hình: Nhà thiết kế quy trình làm việc

  • Nhà phát triển tác vụ

Nó tạo ra các tác vụ Session, Shell Command và Email. Các tác vụ được tạo trong Task Developer có thể sử dụng lại

  • Thiết kế Worklet

Nó tạo ra các đối tượng đại diện cho một tập hợp các nhiệm vụ. Đối tượng Worklet có thể sử dụng lại.

Trình quản lý Dòng công việc cũng hiển thị một thanh trạng thái hiển thị trạng thái của hoạt động bạn thực hiện.

Hình sau minh họa một quy trình công việc điển hình trông như thế nào bao gồm các thành phần tác vụ Bắt đầu, Liên kết và Phiên.

Hình: Ví dụ về Trình quản lý quy trình làm việc

  • Informatica PowerCenter Workflow Monitor

Workflow Monitor, một công cụ PowerCenter, được sử dụng để giám sát việc thực hiện các quy trình và nhiệm vụ công việc.

Workflow Monitor có thể được sử dụng để:

  • Xem chi tiết về dòng công việc hoặc nhiệm vụ đang chạy trong chế độ xem biểu đồ Gantt hoặc chế độ xem tác vụ
  • Chạy, dừng, hủy bỏ và tiếp tục quy trình làm việc hoặc nhiệm vụ
  • Màn hình Dòng công việc hiển thị các dòng công việc đã chạy ít nhất một lần.
  • Bộ giám sát dòng công việc liên tục nhận thông tin từ Dịch vụ tích hợp và Dịch vụ lưu trữ. Nó cũng lấy thông tin từ kho để hiển thị thông tin lịch sử.

Hình: Giám sát quy trình làm việc

Làm thế nào để mở Informatica Workflow Monitor:

Để mở Giám sát dòng công việc, hãy đi tới:

Start> All Programs> lnformatica PowerCenter 9.6.1> Client> PowerCenter Client> PowerCenter Workflow Monitor

Màn hình cũng có thể được mở:

  • Từ Bộ điều hướng Trình quản lý Dòng công việc
    • Trình quản lý dòng công việc có thể được định cấu hình để mở Giám sát dòng công việc khi dòng công việc được chạy từ Trình quản lý dòng công việc
    • Từ Công cụ> Giám sát dòng công việc trong Trình thiết kế, Trình quản lý Dòng công việc hoặc Trình quản lý Kho lưu trữ
  • Hoặc, từ biểu tượng Giám sát quy trình làm việc trên thanh công cụ Công cụ

Hình: Các phần theo dõi quy trình làm việc

  • Tin họcQuản trị viên bảng điều khiển

Bảng điều khiển dành cho quản trị viên Informatica (Công cụ quản trị viên) là công cụ quản trị để quản lý miền Informatica và bảo mật Informatica.Bảng điều khiển Quản trị viên Informatica (công cụ Quản trị viên) có sẵn sau khi cài đặt Informatica.

Hình: Bảng điều khiển dành cho quản trị viên Informatica

Bảng điều khiển quản trị thực hiện các tác vụ sau trong miền:

  • Quản lý các dịch vụ ứng dụng: Nó quản lý tất cả các dịch vụ ứng dụng trong miền, bao gồm cả dịch vụ tích hợp và dịch vụ lưu trữ.
  • Cấu hình các nút: Nó cấu hình các thuộc tính của nút bao gồm thư mục sao lưu và tài nguyên. Nó cho phép các nút tắt và sau đó khởi động lại khi được yêu cầu.
  • Quản lý các đối tượng miền: Nó tạo cũng như quản lý các đối tượng như dịch vụ, nút, giấy phép và thư mục.
  • Xem và chỉnh sửa các thuộc tính đối tượng miền: Nó cho phép các thuộc tính cho tất cả các đối tượng trong miền được xem cũng như chỉnh sửa bên trong nó.
  • Nhiệm vụ hành chính an ninh: Quản lý người dùng, nhóm, vai trò và đặc quyền.
  • Xem các sự kiện nhật ký: Nó sử dụng trình xem nhật ký để xem các sự kiện nhật ký của miền, dịch vụ tích hợp, dịch vụ SAP BW, trung tâm dịch vụ web, cũng như dịch vụ kho lưu trữ.

Hình: Bảng điều khiển dành cho quản trị viên-Giao diện

Vì vậy, tóm lại, thành phần khách hàng của Informatica bao gồm 5 thành phần viz. Người quản lý kho lưu trữ Informatica, Nhà thiết kế Informatica PowerCenter, Trình quản lý dòng công việc Informatica, Bộ giám sát dòng công việc Informatica và Bảng điều khiển dành cho quản trị viên Informatica. Nó tạo thành công việc của toàn bộ công cụ. Bây giờ chúng ta hãy thử hiểu thành phần Máy chủ của Informatica PowerCenter.

Các thành phần máy chủ của Informatica PowerCenter

Các thành phần máy chủ PowerCenter bao gồm các dịch vụ sau:

  • Dịch vụ kho lưu trữ: Dịch vụ Kho lưu trữ quản lý kho. Nó truy xuất, chèn và cập nhật siêu dữ liệu vào các bảng cơ sở dữ liệu của kho lưu trữ.
  • Dịch vụ tích hợp: Dịch vụ Tích hợp chạy các phiên và quy trình làm việc.
  • Dịch vụ SAP BW: Dịch vụ SAP BW tìm kiếm các yêu cầu RFC từ SAP BW và bắt đầu dòng công việc để trích xuất dữ liệu từ hoặc tải dữ liệu vào SAP BW.
  • Trung tâm dịch vụ web: Trung tâm dịch vụ Web nhận yêu cầu từ máy khách dịch vụ web và hiển thị các luồng công việc PowerCenter dưới dạng dịch vụ.

Bây giờ chúng ta đã hiểu cả các thành phần máy khách và máy chủ của Informatica, hình ảnh thông tin sau sẽ giải thích luồng dữ liệu trong Informatica, tức là cách dữ liệu được xử lý:

Hình: Luồng dữ liệu trong Informatica

Tại thời điểm này, rất hợp lý để hiểu các đơn vị cơ bản khác trong Informatica như Domain & Node, Service & Service Manager là gì. Vì vậy, chúng ta hãy dành một chút thời gian để hiểu chúng trước khi chúng ta thực hiện một bài tập trên Informatica.

Tên miền và nút Informatica:

Các tính năng nổi bật của Miền như sau:

  • Miền là một tập hợp logic hoặc tập hợp các nút và dịch vụ
  • Miền PowerCenter là đơn vị quản trị cơ bản của PowerCenter
  • Miền có thể là một cài đặt PowerCenter duy nhất hoặc nó có thể bao gồm nhiều cài đặt PowerCenter

Các tính năng nổi bật của một nút như sau:

  • Một nút là một biểu diễn logic của một máy vật lý. Nó có các thuộc tính vật lý như tên máy chủ và số cổng
  • Mỗi nút chạy một trình quản lý dịch vụ chịu trách nhiệm về ứng dụng và các dịch vụ cốt lõi
  • Một nút có thể là một nút cổng hoặc một nút công nhân, nhưng nó chỉ có thể thuộc về một Miền

Hình: Informatica Domain n Node

Giám đốc Dịch vụ & Dịch vụ Informatica:

Dịch vụ là một tài nguyên cung cấp các chức năng chuyên biệt. Tất cả các quy trình PowerCenter chạy như các dịch vụ trên một nút.

Informatica PowerCenter có hai loại dịch vụ:

  • Dịch vụ Ứng dụng đại diện cho các chức năng dựa trên máy chủ bao gồm Dịch vụ Kho lưu trữ và Tích hợp.
  • Dịch vụ cốt lõi đại diện cho các chức năng quản lý và duy trì môi trường mà PowerCenter hoạt động và bao gồm các dịch vụ như Dịch vụ nhật ký, Dịch vụ cấp phép và Dịch vụ miền trong số nhiều dịch vụ khác.

Quản lý dịch vụ

  • Trình quản lý dịch vụ là một dịch vụ quản lý tất cả các hoạt động của Miền và chạy trên từng nút trong một Miền
  • Trên nút cổng, Trình quản lý dịch vụ chịu trách nhiệm về những việc sau:
    • Kiểm soát miền
    • Quản lý các dịch vụ đang chạy trên Miền
    • Cung cấp tra cứu dịch vụ
  • Trên tất cả các nút, Trình quản lý dịch vụ có nghĩa là kiểm soát các dịch vụ cốt lõi và dịch vụ ứng dụng

Cách các thành phần khác nhau của PowerCenter tương tác:

Hình: Tương tác thành phần Informatica

Trường hợp sử dụng: Cách tải Bảng thứ nguyên sản phẩm bằng SCD

Báo cáo vấn đề: Mục đích của chúng tôi là tải bảng Kích thước sản phẩm bằng Thứ nguyên thay đổi chậm (SCD) Loại 2 sử dụng ngày có hiệu lực.

Với hệ thống nguồn khách hàng chứa thông tin chi tiết về ID khách hàng, Tên, Thành phố, Tiểu bang và Quốc gia của khách hàng, Chúng tôi cần tạo một mục mới trong bảng thứ nguyên mục tiêu mỗi khi khách hàng đến với một giá trị khác.

Để hiểu rõ hơn điều này, nếu khách hàng trả lại với một giá trị khác cho tiểu bang hoặc thành phố so với giá trị đã có trong bảng thứ nguyên mục tiêu, một mục nhập mới phải được tạo với giá trị được cập nhật. Điều này đạt được bằng cách sử dụng bảng mục tiêu dựa trên giải pháp SCD.

Dưới đây là quy trình từng bước tải bảng kích thước sản phẩm bằng SCD.

Bước 1 : Mở PowerCenter Designer.

Bước 2 : Kết nối với kho lưu trữ

Hình: Thiết lập kết nối với Kho lưu trữ

Bước 3 : Khởi chạy Trình thiết kế

Hình: Khởi chạy PowerCenter Designer

Bước 4: Tải nguồn từ Cơ sở dữ liệu

Hình: Các tùy chọn khác nhau để tải tập dữ liệu Nguồn

Bước 5: Kết nối với Cơ sở dữ liệu

Bước 6: Chọn bảng SCD_INPUT_DATA

Bước 7: Tương tự, tải tập hợp mục tiêu từ cơ sở dữ liệu

Hình: Các tùy chọn khác nhau cho các tập hợp Mục tiêu

Bước 8 : Thiết kế quy trình làm việc để thực hiện hoạt động được yêu cầu như bên dưới

Hình: Thiết kế quy trình làm việc cho cơ sở dữ liệu

Bước 9 : Khởi chạy Oracle SQL Developer và tải SCD_CUSTOMER bàn

Hình: bảng SCD_CUSTOMER

Bước 10 : Sửa đổi các giá trị trạng thái cho khách hàng Mary và Hannah

Hình: Sửa đổi các giá trị của Mary

Hình: Sửa đổi các giá trị của Hannah

Bước 11 : Khởi chạy theo dõi quy trình làm việc và thực hiện quy trình làm việc

Hình: Thực thi quy trình làm việc

Hình: Đầu ra quy trình làm việc

tạo lớp singleton trong java

Bước 12: Thực thi lệnh dưới đây để lấy cơ sở dữ liệu được nhắm mục tiêu

  • chọn * từ scd_customer_target

Hình: Thực thi truy vấn SQL cho đầu ra được nhắm mục tiêu

Bước 13: Đầu ra bảng Kích thước sản phẩm

Hình: Đầu ra bảng Kích thước sản phẩm

Để kết luận, bảng sản phẩm được tải chứa các giá trị lịch sử của dữ liệu bao gồm sự thay đổi đối với các giá trị hiện tại và điều này có được bằng cách sử dụng Informatica PowerCenter.

Tôi hy vọng blog Hướng dẫn Informatica này hữu ích để xây dựng nền tảng của Informatica của bạn và đã tạo đủ hứng thú để tìm hiểu thêm về Informatica.

Nếu bạn đã quyết định chọn Informatica như một sự nghiệp, tôi khuyên bạn tại sao không xem qua trang khóa học. Khóa đào tạo Chứng nhận Informatica tại Edureka sẽ giúp bạn trở thành chuyên gia về Informatica thông qua các buổi hướng dẫn trực tiếp của người hướng dẫn và đào tạo thực hành bằng các trường hợp sử dụng thực tế.

Có một câu hỏi cho chúng tôi? Vui lòng đề cập đến nó trong phần bình luận và chúng tôi sẽ liên hệ lại với bạn.