Hướng dẫn SAS: Tất cả những gì bạn cần biết về SAS



Trong blog Hướng dẫn SAS này, hãy tìm hiểu SAS là gì? Nó có thể làm gì và hiểu tại sao SAS là một trong những công cụ phân tích phổ biến nhất trên thị trường.

Câu hỏi - Hướng dẫn SAS - EdurekaSAS là gì? Tại sao tôi nên học SAS?Lợi ích của ?Bạn đang tìm câu trả lời cho những câu hỏi trên? Nếu có, thì cái nàyHướng dẫn SASsẽ trả lời tất cả các câu hỏi của bạn.

Con người chúng ta là một loài tò mò, phải không? Chúng tôi luôn muốn biết thêm. Mong muốn được biết này khiến chúng tôi đặt ra nhiều câu hỏi hơn và do đó, khiến chúng tôi luôn theo dõi để có thêm câu trả lời.





Chúng ta hãy xem xét một vấn đề đơn giản. Điều gì xảy ra nếu bạn muốn đi mua sắm và bạn có hai tùy chọn để lựa chọn:

  • Một phiếu giảm giá $ 149
  • Phiếu giảm giá 25%

Bạn có thể tự hỏi, lựa chọn nào sẽ giúp bạn tiết kiệm hơn?Đây là một kịch bản. Chúng tôi có nhiều câu hỏi như vậy và chúng tôi có thể gặp các tình huống khác nhau mà chúng tôi không thể đưa ra quyết định đúng đắn. Những câu hỏi này có khiến bạn tò mò khôngvề việc tìm kiếm câu trả lời? Nếu có, thì bạn sẽ thích phân tích và cả những công cụ sẽ giúp bạn phân tích dữ liệu. SAS là một trong những công cụ như vậy.



ansible vs con rối vs đầu bếp

Hướng dẫn SAS

Đến cuối bài viết, bạn nên làm quen với các chủ đề sau:

Hiểu biết của bạn về SAS là không đầy đủ nếu không hiểu phân tích dữ liệu.Vậy hãy bắt đầu.

Phân tích dữ liệu là gì?

Từ 'phân tích' đã trở thành xu hướng trong một thời gian, nhưng không có cách nào để định nghĩa nó. Chúng ta hãy thử hiểu phân tích bằng một ví dụ đơn giản. Hãy tưởng tượng, bạn muốn mua một chiếc áo phông. Bạn có thể nghĩ đến những câu hỏi nào? Hãy để tôi giúp bạn với một số cách phổ biến:



  • Nên mua áo thun khi nào?
  • Tôi nên chi bao nhiêu cho chiếc áo phông?
  • Tôi nên mua áo phông trực tuyến hay tôi nên đến cửa hàng?
  • Nếu tôi quyết định mua áo phông trực tuyến, tôi nên mua nó từ trang web nào?
  • Nếu tôi quyết định ghé thăm một cửa hàng, tôi nên ghé thăm cửa hàng nào?

Quyết định có thể phụ thuộc vào các yếu tố như thời gian, tiền bạc, sở thích và kinh nghiệm trước đó. Hãy cùng chúng tôi tiếp tục vấn đề trên. Hãy xem xét những điều sau:

  • Chủ nhật bạn rảnh
  • Ngân sách của bạn là $ 300
  • Bạn thích ghé thăm một cửa hàng hơn vì nó cho phép bạn chọn một chiếc áo phông
  • Bạn quyết định ghé thăm một cửa hàng cụ thể bởi vì lần trước đó của bạn tại cửa hàng đã không làm bạn thất vọng

Dựa trên những điểm trên, giả sử bạn quyết định ghé thăm một cửa hàng vào Chủ nhật và mua một chiếc áo phông có giá khoảng 265 đô la. Bạn đã cân nhắc một vài khả năng, chọn những khả năng phù hợp với yêu cầu và đưa ra quyết định.

Nói một cách đơn giản, bạn vừa thực hiện một số phân tích để giúp bạn mua một chiếc áo phông. Hãy để tôi đơn giản hóa nó hơn nữa. Bộ não của bạn đã làm hai điều đơn giản ở đây:

  • Thông tin được thu thập theo yêu cầu của bạn
  • Hiểu dữ liệu và dựa trên thông tin đó, đã giúp bạn quyết định mua áo phông.

Đây là những gì bạn có thể làm bằng cách sử dụng phân tích. Bạn có thể thu thập thông tin, phân tích nó và đưa ra quyết định tốt hơn. Ví dụ trên làdễ dàng, vì vậy bạn có thể đưa ra quyết định dựa trên một số giả định. Điều gì sẽ xảy ra nếu vấn đề và việc ra quyết định không dễ dàng như vậy?

Hãy xem xét vấn đề này trên quan điểm kinh doanh.Giả sử, một công ty thương mại điện tử muốn nghiên cứu mô hình mua hàng của khách hàng dựa trên dữ liệu trước đó. Công ty sẽ phải xem xét hàng ngàn hồ sơ phải không? Bây giờ, hãy tưởng tượng dữ liệu chúng ta vừa nói về hoặc các hoán vị và kết hợp mà công ty có thể xem xét cho các sở thích khác nhau mà mọi người có thể có.

Ngoài ra, công ty có thể không có tất cả dữ liệu. Ví dụ, nếu một khách hàng không mua một chiếc áo phông, thì yếu tố nào khiến khách hàng quyết định không mua chiếc áo đó? Dữ liệu bị thiếu này có thể tạo ra vấn đề. Làm thế nào để chúng ta đối phó với những vấn đề này? Làm thế nào để chúng tôi xử lý dữ liệu đó? Tốt,những vấn đề này trở nên dễ dàng hơn khi chúng tôi sử dụng phân tích. Bằng cách sử dụng phân tích, bạn có thể loại bỏ dữ liệu không cần thiết và tối ưu hóa thông tin liên quan để tìm ra các mẫu có thể giúp bạn đưa ra quyết định tốt hơn.

Chúng tôi có nhiều công cụ để phân tích và đơn giản hóa các vấn đề như vậy.Một công cụ nổi bật là SAS. Hướng dẫn SAS này, sẽ giúp bạn hiểu về SAS và cách sử dụng nó để giải quyết các vấn đề của chúng ta.

Đăng ký kênh youtube của chúng tôi để cập nhật những thông tin mới ..!

Cần cho SAS

Thị trường phân tích đã phát triển mạnh mẽ trong vài năm qua. Điều này đã dẫn đến việc tăng số lượng công cụ được sử dụng. Tất cả những điều này đều có lợi theo cách này hay cách khác. Vì vậy, chúng ta hãy tiếp tục với hướng dẫn SAS của mình và xem xét một vài công cụ được sử dụng rộng rãi nhất trên thị trường.

  • SAS: Nó là công cụ được sử dụng nhiều nhất trong thị trường phân tích thương mại. Với rất nhiều chức năng thống kê và GUI (Hướng dẫn Doanh nghiệp & Người khai thác) tốt, nó chắc chắn dẫn đầu thị trường.
  • R: Nó là một phần mềm mã nguồn mở. Rất dễ học R vì nó được ghi chép lại rất kỹ lưỡng. Nó tiết kiệm chi phí và có khả năng thống kê mạnh mẽ.
  • Python là một ngôn ngữ kịch bản mã nguồn mở khác được sử dụng rộng rãi. Việc sử dụng Python đã phát triển theo thời gian.Ngày nay, nó có các thư viện thể thao như Numpy, Scipy và MatPlotLib. Bạn có thể thực hiện hầu hết mọi thao tác thống kê hoặc xây dựng bất kỳ mô hình nào bằng các thư viện này.

SAS Vs. R Vs. Python

Hãy để chúng tôi so sánh ba công cụ này trong hướng dẫn SAS này và tôi sẽ sử dụng các thông số sau để so sánh.

1) Việc làm

Là một công cụ quan trọng cho nghiên cứu và phân tích, nó chắc chắn đã tạo ra rất nhiều yêu cầu đối với các nguồn được đào tạo của SAS. SAS nắm giữ 70% thị phần. R nắm giữ 15% và python nắm giữ ít nhất, dưới 10%.

2) Dễ hiểu

SAS là một trong những công cụ dễ học nhất. Ngay cả những người có kiến ​​thức hạn chế về SQL cũng có thể học nó một cách dễ dàng. Python không thuận tiện như SAS dành cho phân tích. R yêu cầu bạn viết những đoạn mã dài dòng và tẻ nhạt, do đó mang lại lợi thế cho SAS.

3) Ngôn ngữ thế hệ thứ tư

SAS là một ngôn ngữ lập trình thế hệ thứ tư. Ngôn ngữ lập trình thế hệ thứ tư là 'ngôn ngữ lập trình được thiết kế với mục đích cụ thể như phát triển phần mềm kinh doanh thương mại.' Nó được thiết kế để giảm công sức lập trình và giảm thiểu thời gian và chi phí để phát triển một phần mềm. R và Python không phải là Ngôn ngữ thế hệ thứ tư.

4) Linh hoạt

SAS luôn cập nhật theo nhu cầu thị trường. Tính dễ tích hợp của nó làm cho nó linh hoạt hơn và có thể sử dụng được. Điều này cũng có nghĩa là nó kết hợp tốt với các công nghệ khác. Làm cho nó linh hoạt theo đúng nghĩa.

Những lý do trên ủng hộ mạnh mẽ nhận định SAS giữ vững vị trí hàng đầu trên thị trường.Vì vậy, bây giờ chúng ta đã xem so sánh ba công cụ phân tích này. Tiếp tục trong phần hướng dẫn SAS này, hãy để chúng tôi hiểu về SAS một cách chi tiết hơn.

Hướng dẫn SAS: SAS là gì ?

Bây giờ chúng ta hãy cố gắng hiểu những gì là SAS và nó làm gì?

SAS là viết tắt của Hệ thống Phân tích Thống kê. Nó là một bộ phần mềm được phát triển bởi SAS Institute.

Ứng dụng SAS

Hình ảnh dưới đây cho thấy một vài ứng dụng của SAS:

Nói một cách đơn giản, SAS có thể xử lý dữ liệu phức tạp và tạo ra những hiểu biết sâu sắc có ý nghĩa để giúp các tổ chức đưa ra quyết định tốt hơn hoặc dự đoán kết quả có thể xảy ra trong tương lai gần.

SAS cho phép bạn Khai thác, Thay đổi, Quản lý và Lấy dữ liệu từ các nguồn khác nhau và phân tích nó.Giao diện người dùng đồ họa trỏ và nhấp của SAS hỗ trợ người dùng không chuyên về kỹ thuật sử dụng các tính năng của nó cho các hoạt động đồ họa và các tùy chọn nâng cao.

Hướng dẫn SAS | Hướng dẫn SAS để Phân tích Dữ liệu | Edureka

Các thành phần SAS

Hãy để chúng tôi tiếp tục với hướng dẫn SAS của chúng tôi và xem xét một số thành phần quan trọng của SAS:

  • Cơ sở SAS: Nó là thành phần được sử dụng rộng rãi nhất. Nó có cơ sở quản lý dữ liệu. Bạn có thể thực hiện phân tích dữ liệu bằng Base SAS.
  • SAS / ĐỒ HỌA: Với việc sử dụng SAS / Graph, bạn có thể biểu diễn dữ liệu dưới dạng đồ thị. Điều này làm cho việc trực quan hóa dữ liệu trở nên dễ dàng.
  • SAS / STAT: Nó cho phép bạn thực hiện phân tích Thống kê, chẳng hạn như Phương sai, Hồi quy, Đa biến, Tỷ lệ sống và phân tích Tâm lý.
  • SAS / ETS: Nó phù hợp cho Phân tích chuỗi thời gian.

Vì đây là một bài viết giới thiệu, chúng tôi sẽ tập trung vào Base SAS và tôi chắc chắn, mọi người sẽ dễ hiểu.

Quan tâm đến việc học SAS từ các chuyên gia? Đăng ký ngay

SAS như một ngôn ngữ lập trình

Hầu hết các môi trường lập trình đều là hướng menu (trỏ và nhấp) hoặc theo lệnh (nhập và thực hiện lệnh). Tuy nhiên, SAS không phải là trình điều khiển trình đơn hoặc điều khiển lệnh. Điều này là do nó sử dụng một loạt các lệnh hoặc câu lệnh được gọi là chương trình SAS. Chương trình này mô tả những gì bạn muốn làm và được viết bằng ngôn ngữ SAS.

ví dụ về mảng đối tượng java

Dữ liệu

Dữ liệu là trung tâm của mọi tập dữ liệu. Trong SAS, dữ liệu có sẵn ở dạng bảng trong đó các biến chiếm không gian cột và các quan sát chiếm không gian hàng.

Loại dữ liệu:

SAS coi số là dữ liệu số và mọi thứ khác thuộc dữ liệu ký tự. Do đó SAS có hai kiểu dữ liệu, số và ký tự. Dễ dàng, phải không?

Bước DATA và bước PROC tạo thành các khối xây dựng cơ bản của một chương trình SAS. Những gì chúng ta sẽ thảo luận trong hướng dẫn SAS này.

Xây dựng các khối của SAS

Chúng tôi bắt đầu một chương trình với bước DATA để tạo tập dữ liệu SAS và sau đó chuyển dữ liệu vào bước PROC. Bước PROC xử lý dữ liệu. Để hiểu cách hoạt động của các bước DATA và PROC, chúng ta hãy xem xét ví dụ dưới đây.

Giả sử tôi muốn chuyển đổi một số tính bằng inch sang cm và lưu trữ kết quả trong một biến có tên là 'size' và in nó, sau đó bước DATA sẽ chuyển đổi số theo inch sang cm và bước PROC sẽ in kết quả.

Hình ảnh bên dưới hiển thị đoạn mã cho vấn đề được đề cập ở trên:

Các câu lệnh tạo thành các bước DATA và PROC. Độ dài của một bước có thể thay đổi từ một, đến hơn trăm câu lệnh. Điều quan trọng là bạn cần nhớ rằng các bước DATA được sử dụng để đọc và sửa đổi dữ liệu, trong khi các bước PROC được sử dụng để phân tích dữ liệu, thực hiện các chức năng tiện ích hoặc in báo cáo.

Các bước DATA bắt đầu với từ khóa DATA, theo sau là tên mà bạn chọn cho tập dữ liệu SAS của mình. Rõ ràng là bước DATA trên tạo ra một tập dữ liệu có tên là kích thước. Các bước DATA đọc dữ liệu từ các tệp dữ liệu bên ngoài và cũng có thể được sử dụng để bao gồm các vòng lặp và câu lệnh trường hợp. Nó có thể được sử dụng để hợp nhất, sắp xếp, kết hợp và nối dữ liệu.

Tương tự, các thủ tục bắt đầu với một câu lệnh PROC trong đó từ khóa PROC theo sau tên của thủ tục được sử dụng (ví dụ: tên của thủ tục có thể là PRINT, SORT hoặc MEAN). Các thủ tục SAS hầu hết có một số ít các tuyên bố khả thi.

Mỗi khi SAS đi qua một bước mới (được đánh dấu bằng câu lệnh DATA hoặc PROC), nó sẽ kết thúc hoặc kết thúc bước trước đó và bắt đầu bằng bước mới.

Mặc dù một chương trình điển hình bắt đầu với bước DATA để nhập hoặc sửa đổi dữ liệu, sau đó chuyển dữ liệu sang bước PROC, nhưng chắc chắn đây không phải là mẫu duy nhất để trộn các bước DATA và PROC. Chỉ cần bạn có thểxếp chồng các khối xây dựngtheo bất kỳ thứ tự nào, bạn có thể sắp xếp các bước DATA và PROC theo bất kỳ thứ tự nào. Một chương trình thậm chí có thể chỉ chứa các bước DATA hoặc chỉ các bước PROC.

Tuy nhiên, bạn sẽ thấy viết chương trình SAS dễ dàng hơn nhiều nếu bạn hiểu các chức năng cơ bản này. Trên đây là một vài điều cơ bản mà mọi người mới bắt đầu học SAS nên biết. Chuyển sang phần tiếp theo của hướng dẫn SAS của chúng tôi, hãy để chúng tôi hiểu cách cài đặt phiên bản đại học SAS.

Bây giờ người mới bắt đầu có thể học và thực hành SAS, như SAS Institute Inc Đã phát hành Phiên bản Đại học SAS có sẵn miễn phí. Tất cả các tính năng cần thiết để học Base SAS đều có sẵn tại đây. Learning Base SAS sẽ giúp bạn dễ dàng học các thành phần khác.

Các bước sau đây sẽ giúp bạn cài đặt SAS University Edition.Nó là một phần mềm sử dụng mà bạn có thể thực hành lập trình SAS.

Hướng dẫn SAS: Cài đặt

Cài đặt SAS University Edition rất dễ dàng. Tuy nhiên, tính khả dụng của nó như một máy ảo đòi hỏi bạn phải chạy nó trong một môi trường ảo. Bạn cần cài đặt phần mềm ảo hóa trên PC trước khi chạy phần mềm SAS. Các bước sau sẽ giúp bạn tải xuống và thiết lập môi trường SAS.

1) Tải xuống SAS University Edition

SAS University Edition có thể được tải xuống từ liên kết này Phiên bản Đại học SAS . Nếu bạn nhấp vào liên kết trên, cửa sổ sau sẽ xuất hiện. Vui lòng đọc chi tiết yêu cầu trước khi bạn bắt đầu tải xuống.

2) Hướng dẫn Bắt đầu Nhanh để Cài đặt

Những người hoàn toàn mới đối với quá trình cài đặt, có thể xem qua các hướng dẫn và video có sẵn sau đây như ở bước 1. Đây là tùy chọn và bạn có thể bỏ qua nếu đã quen thuộc.

3) Thiết lập phần mềm ảo hóa

Các liên kết trong bước 2 sẽ cho phép bạn tải xuống phần mềm ảo hóa phù hợp. Bạn có thể bỏ qua bước này nếu bạn đã cài đặt Phần mềm ảo hóa.

4) Tải xuống tệp Zip

Chọn phiên bản phù hợp của SAS University Edition tương thíchvới môi trường ảo hóa mà bạn có. Nó sẽ tải xuống dưới dạng tệp zip. Tênsẽ tương tự như: ‘Unvbasicvapp_9411005_vmx_en_sp0_1.zip’

5) Giải nén tệp Zip

Giải nén tệp nén ở trên và lưu trữ trong một thư mục thích hợp.

6) Tải Máy ảo

java chuyển đổi double thành int

Mở và khởi động trình phát VMware của bạn, tìm tệp kết thúc bằng phần mở rộng .vmx và mở nó. Màn hình sau sẽ được hiển thị. Vui lòng ghi lại các cài đặt cơ bản như bộ nhớ và dung lượng đĩa cứng được phân bổ để bạn tham khảo.

7) Bật nguồn Máy ảo

Nhấp vào Bật máy ảo này cùng với dấu mũi tên màu xanh lá cây, cho phép bạn khởi động máy ảo. Màn hình sau sẽ xuất hiện.

Trong khi tải, màn hình sau sẽ xuất hiện. Sau đó, bạn có thể chạy máy ảo. Bạn sẽ nhận được lời nhắc truy cập URL sẽ mở môi trường SAS.

8) S tarting SAS Studio

Mở một tab mới trên trình duyệt của bạn và tải URL được đánh dấu trong hình trên. Màn hình sau sẽ xuất hiện để cho biết sự sẵn sàng của môi trường SAS. Bạn có thể nhận được một URL khác bởi vì, URLcó thể khác từ PC sang PC.

Bạn có thể bắt đầu phòng thu và bạn đã sẵn sàng.

Chạy chương trình SAS

Bây giờ chúng ta đã hiểu cách cài đặt SAS University Edition, tiếp theo trong Hướng dẫn SAS của chúng ta, chúng ta hãy xem một chương trình SAS mẫu.

Đoạn mã dưới đây cho thấy cách in một dãy Fibonacci. Trong trường hợp, nếu bạn không biết dãy Fibonacci là gì, hãy để tôi định nghĩa nó cho bạn.

Dãy Fibonacci là một tập hợp các số bắt đầu bằng số một hoặc số 0, sau đó là số một và tiến hành dựa trên quy tắc mỗi số (được gọi là số Fibonacci) bằng tổng của hai số đứng trước. Nếu dãy Fibonacci được ký hiệu là F (n), trong đó n là số hạng đầu tiên trong dãy, thì phương trình sau đây cho thấy dãy Fibonacci cho n = 0, trong đó hai số hạng đầu tiên được định nghĩa là 0 và 1 theo quy ước:

F (0) = 0, 1, 1, 2, 3, 5, 8, 13, 21, 34…

Trong một số ngữ cảnh, thường sử dụng n = 1. Trong trường hợp đó, hai thuật ngữ đầu tiên được định nghĩa là 1 và 1 theo mặc định, và do đó:

F (1) = 1, 1, 2, 3, 5, 8, 13, 21, 34…

Chúng ta hãy xem mã SAS này tạo ra một chuỗi Fibonacci bắt đầu bằng một.

DATA Fibonacci Do i = 1 đến 10 Fib = Sum (Fib, lag (Fib)) nếu i = 1 thì Fib = 1 đầu ra kết thúc PROC PRINT Fibonacci Run

Trong đoạn mã trên, chúng tôi đã định nghĩa một hàm được gọi là 'Fib' để tính toán số tiếp theo. Fib bằng tổng của số Fib hiện tại và trước đóFibonaccicon số. Chúng tôi sử dụng hàm lag để truy xuất hàm cuối cùng và lấy giá trị của số fib trước đó.

Hình ảnh sau đây cho thấy đầu ra của đoạn mã trên. Chúng tôi đã sử dụng quy trình PROC PRINT để hiển thị kết quả đầu ra ở dạng in.

Tôi hy vọng bạn thích blog hướng dẫn SAS này. Đây là blog đầu tiên của loạt blog Hướng dẫn SAS. Blog tiếp theo của tôi sẽ là về lập trình SAS, hãy đọc nó cũng như để tìm hiểu cách viết chương trình trong SAS.

Nếu bạn muốn học SAS và xây dựng sự nghiệp trong lĩnh vực phân tích, hãy xem đi kèm với đào tạo trực tiếp do người hướng dẫn và trải nghiệm dự án thực tế.Khóa đào tạo này sẽ giúp bạn hiểu sâu hơn về SAS và giúp bạn thành thạocác khái niệm khác nhau của ngôn ngữ SAS.

Quan tâm đến việc học SAS từ các chuyên gia? Đăng ký ngay

Có một câu hỏi cho chúng tôi? Vui lòng đề cập đến nó trong phần bình luận và chúng tôi sẽ liên hệ lại với bạn.