Tại sao bạn nên kết hợp khi bạn đã có thể tham gia Tableau?



Kết hợp dữ liệu trong Tableau - một phương pháp được sử dụng khi có dữ liệu liên quan trong nhiều nguồn dữ liệu mà bạn muốn phân tích cùng nhau trong một chế độ xem duy nhất.

Trong một thế giới tạo ra và tiêu thụ 2,5 nghìn tỷ byte dữ liệu, mỗi ngày, các tổ chức nhất định phải tìm kiếm các phương pháp mới để chuyển đổi và kết hợp dữ liệu nhằm đạt được hiệu quả tối ưu. Một phương pháp kết hợp dữ liệu như vậy là Kết hợp dữ liệu trong Tableau .

Bây giờ, vì điều này phục vụ một mục đích quan trọng như vậy trong chu trình dữ liệu của bất kỳ tổ chức cụ thể nào, nó tạo ra một mô-đun rất cần thiết trong hầu hết . Trong blog này, chúng ta sẽ thảo luận về các khái niệm sau:





Tại sao bạn cần Kết hợp dữ liệu trong Tableau?

Giả sử, bạn là một Bảng nhà phát triển người có dữ liệu giao dịch được lưu trữ trong Salesforce và dữ liệu hạn ngạch được lưu trữ trong Access. Dữ liệu bạn muốn kết hợp được lưu trữ trong các cơ sở dữ liệu khác nhau và mức độ chi tiết của dữ liệu được thu thập trong mỗi bảng ở hai nguồn dữ liệu là khác nhau, vì vậy kết hợp dữ liệu là cách tốt nhất để kết hợp dữ liệu này.

Kết hợp dữ liệu hữu ích trong các điều kiện sau:



  1. Bạn muốn kết hợp dữ liệu từ các cơ sở dữ liệu khác nhau mà không được phép nối cơ sở dữ liệu chéo hỗ trợ.

    Các phép nối cơ sở dữ liệu chéo không hỗ trợ các kết nối với hình khối (ví dụ: Oracle Essbase) hoặc với một số kết nối chỉ trích xuất (ví dụ: Google Analytics). Trong trường hợp này, hãy thiết lập các nguồn dữ liệu riêng lẻ cho dữ liệu bạn muốn phân tích, sau đó sử dụng kết hợp dữ liệu để kết hợp các nguồn dữ liệu trên một trang tính.

  2. Dữ liệu ở các mức độ chi tiết khác nhau.

    Đôi khi một tập dữ liệu thu thập dữ liệu bằng cách sử dụng mức độ chi tiết tức là, mức độ chi tiết lớn hơn hoặc nhỏ hơn so với tập dữ liệu khác.

    Ví dụ: giả sử bạn đang phân tích dữ liệu giao dịch và dữ liệu hạn ngạch. Dữ liệu giao dịch có thể nắm bắt tất cả các giao dịch. Tuy nhiên, dữ liệu hạn ngạch có thể tổng hợp các giao dịch ở cấp quý. Vì các giá trị giao dịch được ghi lại ở các mức độ chi tiết khác nhau trong mỗi tập dữ liệu, bạn nên sử dụng kết hợp dữ liệu để kết hợp dữ liệu.



Kết hợp dữ liệu trong Tableau là gì?

Kết hợp dữ liệu là một tính năng rất mạnh mẽ trong Bảng . Nó được sử dụng khi có dữ liệu liên quan trong nhiều nguồn dữ liệu mà bạn muốn phân tích cùng nhau trong một chế độ xem. Đây là phương pháp kết hợp dữ liệu bổ sung bảng dữ liệu từ một nguồn dữ liệu với các cột dữ liệu từ nguồn dữ liệu khác.

Thông thường, bạn sử dụng phép nối để thực hiện kiểu kết hợp dữ liệu này, nhưng đôi khi, tùy thuộc vào các yếu tố như loại dữ liệu và mức độ chi tiết của nó, khi đó tốt hơn nên sử dụng kết hợp dữ liệu.

Nó khác với kết hợp dữ liệu như thế nào?

Kết hợp dữ liệu mô phỏng một phép nối trái truyền thống. Sự khác biệt chính giữa hai là khi nào phép nối được thực hiện liên quan đến tổng hợp.

Chỗ nối bên trái

Khi bạn sử dụng một phép nối bên trái để kết hợp dữ liệu, một truy vấn sẽ được gửi đến cơ sở dữ liệu nơi phép nối được thực hiện. Sử dụng phép nối bên trái trả về tất cả các hàng từ bảng bên trái và bất kỳ hàng nào từ bảng bên phải có khớp hàng tương ứng trong bảng bên trái. Kết quả của việc tham gia sau đó sẽ được Tableau gửi lại và tổng hợp.

Ví dụ, giả sử bạn có các bảng sau. Nếu các cột chung là Tên người dùng , phép nối bên trái lấy tất cả dữ liệu từ bảng bên trái, cũng như tất cả dữ liệu từ bảng bên phải vì mỗi hàng có một khớp hàng tương ứng trong bảng bên trái.

cách tìm số lớn nhất trong một mảng java

Kết hợp dữ liệu - Kết hợp dữ liệu trong Tableau - EdurekaKết hợp dữ liệu

Khi bạn sử dụng kết hợp dữ liệu để kết hợp dữ liệu, một truy vấn sẽ được gửi đến cơ sở dữ liệu cho từng nguồn dữ liệu được sử dụng trên trang tính. Kết quả của các truy vấn, bao gồm cả dữ liệu tổng hợp, được gửi lại và kết hợp bởi Tableau. Chế độ xem sử dụng tất cả các hàng từ nguồn dữ liệu chính, bảng bên trái và các hàng tổng hợp từ nguồn dữ liệu phụ, bảng bên phải, dựa trên thứ nguyên của các trường liên kết.

Bạn có thể thay đổi trường liên kết hoặc thêm nhiều trường liên kết hơn để bao gồm các hàng dữ liệu khác nhau hoặc bổ sung từ nguồn dữ liệu phụ trong hỗn hợp, thay đổi các giá trị tổng hợp.

Ví dụ, giả sử bạn có các bảng sau. Nếu các trường liên kết là Tên người dùng trong cả hai bảng kết hợp dữ liệu của bạn sẽ lấy tất cả dữ liệu từ bảng bên trái và bổ sung cho bảng bên trái với dữ liệu từ bảng bên phải. Trong trường hợp này, không phải tất cả các giá trị đều có thể là một phần của bảng kết quả vì lý do sau:

  • Một hàng trong bảng bên trái không khớp với hàng tương ứng trong bảng bên phải, như được chỉ ra bởi giá trị null.
  • Có nhiều giá trị tương ứng trong các hàng trong bảng bên phải, như được biểu thị bằng dấu hoa thị (*).

Giả sử bạn có các bảng tương tự như trên, nhưng nguồn dữ liệu phụ chứa một trường mới được gọi là Mục đích . Một lần nữa, nếu trường liên kết là Tên người dùng , kết hợp dữ liệu của bạn sẽ lấy tất cả dữ liệu từ bảng bên trái và bổ sung nó với dữ liệu từ bảng bên phải. Trong trường hợp này, bạn sẽ thấy cùng một giá trị null và dấu hoa thị trong ví dụ trước ngoài giá trị sau:

  • Bởi vì Mục đích trường là thước đo, bạn sẽ thấy các giá trị hàng choMục đíchtrường được tổng hợp trước khi dữ liệu trong bảng bên phải được kết hợp với dữ liệu trong bảng bên trái.
  • Như với ví dụ trước, một hàng trong bảng bên trái không có hàng tương ứng cho Mục đích , như được chỉ ra bởi giá trị rỗng thứ hai.

Khi nào nên thay thế tham gia Pha trộn

1. Dữ liệu cần làm sạch.

Nếu các bảng của bạn không khớp chính xác với nhau sau khi kết hợp, hãy thiết lập nguồn dữ liệu cho mỗi bảng, thực hiện bất kỳ tùy chỉnh cần thiết nào (nghĩa là đổi tên cột, thay đổi kiểu dữ liệu cột, tạo nhóm, sử dụng tính toán, v.v.) và sau đó sử dụng kết hợp dữ liệu để kết hợp dữ liệu.

2. Tham gia gây ra dữ liệu trùng lặp.

Dữ liệu trùng lặp sau khi kết hợp là một dấu hiệu của dữ liệu ở các mức độ chi tiết khác nhau. Nếu bạn nhận thấy dữ liệu trùng lặp, thay vì tạo kết hợp, hãy sử dụng kết hợp dữ liệu để kết hợp trên một thứ nguyên chung.

3. Bạn có nhiều dữ liệu.

Thông thường, các phép nối được khuyến nghị để kết hợp dữ liệu từ cùng một cơ sở dữ liệu. Các phép nối được cơ sở dữ liệu xử lý, cho phép các phép nối tận dụng một số khả năng gốc của cơ sở dữ liệu. Tuy nhiên, nếu bạn đang làm việc với các bộ dữ liệu lớn, các phép nối có thể gây căng thẳng cho cơ sở dữ liệu và ảnh hưởng đáng kể đến hiệu suất. Trong trường hợp này, kết hợp dữ liệu có thể hữu ích. Vì Tableau xử lý việc kết hợp dữ liệu sau khi dữ liệu được tổng hợp nên sẽ có ít dữ liệu hơn để kết hợp. Nói chung, khi có ít dữ liệu hơn để kết hợp, hiệu suất được cải thiện.

Kết hợp dữ liệu của bạn trong Tableau

Bạn có thể sử dụng kết hợp dữ liệu khi bạn có dữ liệu trong các nguồn dữ liệu riêng biệt mà bạn muốn phân tích cùng nhau trên một trang tính. Tableau có hai nguồn dữ liệu sẵn có được đặt tên là Cửa hàng mẫuChuỗi cà phê mẫu.mdb sẽ được sử dụng để minh họa việc trộn dữ liệu.

Bước 1: Kết nối với dữ liệu của bạn và thiết lập các nguồn dữ liệu

  • Kết nối với một tập hợp dữ liệu và thiết lập nguồn dữ liệu trên trang nguồn dữ liệu. An tôinguồn dữ liệu nbuilt Chuỗi cà phê mẫu.mdb ,là một tệp cơ sở dữ liệu MS Access, sẽ được sử dụng để minh họa việc trộn dữ liệu.
  • Đi đến Dữ liệu > Nguồn dữ liệu mới, kết nối với tập dữ liệu thứ hai.Ví dụ này sử dụng Mẫu - Siêu cửa hàng nguồn dữ liệu. Then thiết lập nguồn dữ liệu.
  • Nhấp vào tab trang tính để bắt đầu xây dựng chế độ xem của bạn.

Bước 2: Chỉ định nguồn dữ liệu chính

  • Kéo ít nhất một trường từ nguồn dữ liệu chính của bạn vào chế độ xem để chỉ định trường đó làm nguồn dữ liệu chính. bên trong Dữ liệu , bấm vào nguồn dữ liệu mà bạn muốn chỉ định làm nguồn dữ liệu chính. Trong ví dụ này, Chuỗi cà phê mẫu đã được chọn.
  • Ảnh chụp màn hình sau đây cho thấy các bảng và liên kết khác nhau có sẵn trong tệp.

cách triển khai danh sách liên kết trong c

Bước 3: Chỉ định nguồn dữ liệu phụ

  • Các trường được sử dụng trong chế độ xem từ các nguồn dữ liệu không phải là nguồn dữ liệu chính hoặc các liên kết đang hoạt động sẽ tự động chỉ định các nguồn dữ liệu tiếp theo làm nguồn dữ liệu phụ. Trong trường hợp này, Siêu cửa hàng mẫu.

Bước 4: Kết hợp dữ liệu

  • Giờ đây, bạn có thể tích hợp dữ liệu từ cả hai nguồn dựa trên một thứ nguyên chung ( Tiểu bang , trong trường hợp này). Lưu ý rằng một hình ảnh liên kết nhỏ xuất hiện bên cạnh thứ nguyên - Trạng thái. Điều này cho biết thứ nguyên chung giữa hai nguồn dữ liệu.
  • Giả sử bạn tạo một biểu đồ thanh với Lợi nhuận trong Giá cột và Tiểu bang trong Giá hàng, biểu đồ cho thấy tỷ lệ lợi nhuận thay đổi như thế nào đối với từng tiểu bang ở cả chuỗi cửa hàng siêu thị và chuỗi cửa hàng cà phê.

Hạn chế của hỗn hợp dữ liệu trong Tableau

  1. Có một số hạn chế về kết hợp dữ liệu xung quanh các tổng hợp không phụ gia, chẳng hạn như TRUNG BÌNHRAWSQLAGG .
  2. Kết hợp dữ liệu làm giảm tốc độ của Truy vấn ở mức độ Chi tiết cao.
  3. Khi bạn cố gắng sắp xếp theo trường được tính toán sử dụng dữ liệu kết hợp, trường được tính toán không được liệt kê trong danh sách Trường thả xuống của hộp thoại Sắp xếp.
  4. Nguồn dữ liệu hình khối chỉ có thể được sử dụng làm nguồn dữ liệu chính để kết hợp dữ liệu trong Tableau. Chúng không thể được sử dụng làm nguồn dữ liệu thứ cấp.

Tôi hy vọng tất cả các bạn, bây giờ, có một ý tưởng công bằng về Kết hợp dữ liệu trong Tableau từ blog này. Đói thêm kiến ​​thức? Đừng lo lắng, video này sẽ giúp bạn hiểu rõ hơn về khái niệm này.