DATA WAREHOUSE LÀ GÌ

     

Data Warehouse là gì?

Data Warehouse tức là kho dữ liệu là một loại quản lý dữ liệu hệ thống có phong cách thiết kế để cho phép và hỗ trợ marketing thông minh vận động BI, nhất là phân tích. Data Warehouse chỉ nhằm mục đích thực hiện các tróc nã vấn cùng phân tích với thường chứa một lượng khủng dữ liệu. Tài liệu trong Data Warehouse thường xuyên được lấy từ không ít nguồn như tệp nhật ký vận dụng và ứng dụng giao dịch.

Bạn đang xem: Data warehouse là gì

Data Warehouse tập trung và tổng đúng theo một lượng khủng dữ liệu từ rất nhiều nguồn. Năng lực phân tích Data Warehouse chất nhận được các tổ chức triển khai thu được hồ hết hiểu biết sale có quý giá từ dữ liệu của họ để nâng cao việc ra quyết định. Theo thời gian, nó xây dựng một hồ sơ lịch sử có thể là vô giá so với các công ty Data Science với nhà so với kinh doanh.

Một Data Warehouse điển hình nổi bật thường bao hàm các yếu tố sau:

Một cơ sở dữ liệu quan hệ để lưu trữ và cai quản dữ liệu.Giải pháp trích xuất, cài đặt và đổi khác ELT để chuẩn bị dữ liệu mang đến phân tích.Khả năng so với thống kê, báo cáo và khai thác dữ liệu.Các luật phân tích quý khách hàng để trực quan liêu hóa và trình diễn dữ liệu cho tất cả những người dùng doanh nghiệp.
*
*
*

Lợi ích của Data Warehouse

Data Warehouse đem về lợi ích bao che và duy nhất là chất nhận được các tổ chức triển khai phân tích một lượng lớn dữ liệu biến thể với trích xuất quý hiếm đáng tính từ lúc nó, cũng tương tự lưu giữ hồ sơ lịch sử.

Bốn đặc điểm độc đáo (được miêu tả bởi đơn vị khoa học laptop William Inmon, người được nhìn nhận là thân phụ đẻ của kho dữ liệu) có thể chấp nhận được các kho dữ liệu đem lại lợi ích bao che này là:

Theo định hướng chủ đề: Họ rất có thể phân tích tài liệu về một chủ đề hoặc lĩnh vực chức năng cụ thể ví dụ như bán hàng.Tích hợp: Kho dữ liệu tạo thành sự đồng hóa giữa các kiểu dữ liệu khác nhau từ những nguồn không giống nhau.Cố định dữ liệu: Khi tài liệu nằm trong kho dữ liệu, nó bình ổn và không nạm đổi.Biến thể thời gian: đối chiếu kho dữ liệu xem xét sự biến hóa theo thời gian.

Một Data Warehouse được thiết kế tốt sẽ thực hiện các truy hỏi vấn rất cấp tốc chóng, cung cấp thông tin lượng dữ liệu cao và cung ứng đủ tính linh hoạt cho những người dùng cuối hoặc giảm cân nặng dữ liệu để khám nghiệm kỹ rộng nhằm đáp ứng nhiều nhu cầu khác biệt cho dù tại mức độ hết sức tốt, chi tiết. Kho tài liệu đóng phương châm là nền tảng công dụng cho môi trường xung quanh phần mềm BI trung gian cung cấp cho những người dùng cuối các báo cáo, trang tổng quan lại và những giao diện khác.

Data Warehouse chuyển động như thay nào?

Data Warehouse vận động như một kho lưu trữ trung trọng điểm nơi thông tin tới từ một hoặc nhiều nguồn dữ liệu. Dữ liệu chảy vào kho tài liệu từ khối hệ thống giao dịch và các cơ sở dữ liệu tương quan khác.

Dữ liệu hoàn toàn có thể là/được:

Cấu trúcBán cấu trúcDữ liệu phi cấu trúc

Dữ liệu được xử lý, biến đổi và nhập để bạn dùng có thể truy cập dữ liệu đã xử lý trong Data Warehouse thông qua các hình thức Business Intelligence, SQL client cùng bảng tính. Data Warehouse vừa lòng nhất tin tức đến từ những nguồn khác nhau vào một cơ sở dữ liệu toàn diện.


Bằng biện pháp hợp nhất toàn bộ các tin tức này ở một nơi, một tổ chức hoàn toàn có thể phân tích khách hàng hàng của mình một cách toàn vẹn hơn. Điều này giúp bảo vệ rằng nó vẫn xem xét tất cả các thông tin có sẵn. Data Warehouse có tác dụng cho khai thác dữ liệu là rất có thể làm được. Khai thác dữ liệu sẽ tìm kiếm những mẫu vào dữ liệu để sở hữu được doanh thu và hiệu quả cực tốt hơn.

Các một số loại Data Warehouse

Ba các loại Data Warehouse thiết yếu là:

1. Enterprise Data Warehouse (Data Warehouse doanh nghiệp)

Data Warehouse công ty hay còn được gọi kho tài liệu doanh nghiệp là một kho tập trung. Tính năng cung cấp dịch vụ cung ứng quyết định trên toàn doanh nghiệp. Hình như cung cấp một biện pháp tiếp cận thống nhất để tổ chức và đại diện dữ liệu. Với thêm nữa là hỗ trợ khả năng phân loại dữ liệu theo chủ đề và cấp cho quyền truy cập theo các bộ phận đó.

2. Operational Data Store ( Kho lưu trữ dữ liệu hoạt động)

Kho lưu trữ dữ liệu hoạt động, có cách gọi khác là ODS, không tồn tại gì bên cạnh kho lưu trữ dữ liệu quan trọng khi cả Data Warehouse và khối hệ thống OLTP không hỗ trợ các tổ chức báo cáo nhu cầu. Vào ODS, kho dữ liệu được gia công mới theo thời gian. Vì chưng đó, nó được ưa thích rộng thoải mái cho các vận động thường ngày như lưu trữ hồ sơ của nhân viên.


3. Data Mart

Một data mart là 1 tập hợp nhỏ của Data Warehouse, được thiết kế với đặc biệt cho 1 ngành sale cụ thể, chẳng hạn như bán hàng, tài chính, bán hàng hoặc tài chính. Trong một data mart độc lập, dữ liệu hoàn toàn có thể thu thập thẳng từ những nguồn.

Các nguyên tố Data Warehouse

Bốn thành phần của Data Warehouse là:

Quản lý phụ tải: thống trị phụ tải còn gọi là thống trị phía cầu. Nó thực hiện với toàn bộ các vận động liên quan tới sự việc trích xuất cùng tải tài liệu vào kho. Các chuyển động này bao hàm các phép đổi khác để chuẩn bị dữ liệu nhằm nhập vào kho dữ liệu.

Quản lý warehouse: làm chủ warehouse tiến hành các chuyển động liên quan mang đến việc làm chủ dữ liệu vào kho, được thực hiện các hoạt động như phân tích tài liệu để bảo vệ tính duy nhất quán, tạo các chỉ mục và khung nhìn, tạo nên sự không chuẩn chỉnh hóa với tổng hợp, biến đổi và hợp nhất tài liệu nguồn và lưu trữ và dữ liệu.

Trình làm chủ truy vấn: Trình quản lý truy vấn còn được gọi là thành phần phụ trợ. Nó thực hiện tất cả các chuyển động liên quan mang lại việc quản lý các tróc nã vấn của người dùng. Các hoạt động vui chơi của các yếu tắc Data Warehouse này là các truy vấn trực tiếp nối các bảng say đắm hợp ném lên lịch triển khai các truy hỏi vấn.

Xem thêm: Mncs Là Gì ? Định Nghĩa, Khái Niệm Mnc Và Những Thông Tin Cần Biết Về Mnc


Công cụ truy cập của người tiêu dùng cuối:

Công vậy này được phân các loại thành năm nhóm không giống nhau như:

Báo cáo dữ liệu; luật pháp truy vấn; Công cụ cách tân và phát triển ứng dụng; qui định EIS; giải pháp OLAP với công cụ khai thác dữ liệu.

Ai nên sử dụng Data Warehouse?

Data Warehouse là quan trọng cho tất cả các loại người tiêu dùng như:

Những người ra quyết định dựa vào trọng lượng dữ liệu.Người sử dụng sử dụng các quy trình phức tạp, tùy chỉnh để rước thông tin từ nhiều nguồn dữ liệu.Nó cũng rất được sử dụng bởi những người dân muốn technology đơn giản để truy cập dữ liệuNó cũng cần thiết cho những người muốn có một bí quyết tiếp cận tất cả hệ thống để lấy ra quyết định.Nếu người dùng muốn năng suất nhanh trên một lượng tài liệu khổng lồ cần thiết cho các báo cáo, lưới hoặc biểu đồ, thì Data Warehouse đang trở đề nghị hữu ích.Data Warehouse là bước đầu tiên nếu bạn có nhu cầu khám phá ‘các mẫu mã ẩn’ của luồng dữ liệu và nhóm.

Kiến trúc Data Warehouse

Kiến trúc của một Data Warehouse được xác minh bởi các nhu cầu cụ thể của tổ chức. Các kiến trúc phổ biến bao gồm:

Simple: tất cả các Data Warehouse đều có chung một kiến tạo cơ bản, trong các số ấy siêu dữ liệu, dữ liệu tóm tắt và tài liệu thô được tàng trữ trong kho lưu trữ trung trọng tâm của kho. Kho tàng trữ được cung ứng bởi những nguồn dữ liệu ở 1 đầu cùng được người dùng cuối truy cập để phân tích, report và khai thác ở đầu kia.

Simple with a staging area: Dữ liệu hoạt động phải được gia công sạch và xử lý trước khi đưa vào kho. Tuy nhiên điều này có thể được tiến hành theo chương trình, nhiều kho dữ liệu bổ sung cập nhật thêm một vùng phân bố cho dữ liệu trước khi dữ liệu vào kho, để đơn giản và dễ dàng hóa việc chuẩn bị dữ liệu.

Hub and spoke: việc thêm những kho tài liệu giữa kho tàng trữ trung vai trung phong và người dùng cuối được cho phép một tổ chức tùy chỉnh cấu hình kho dữ liệu của bản thân để ship hàng các ngành sale khác nhau. Khi tài liệu đã sẵn sàng chuẩn bị để sử dụng, nó sẽ tiến hành chuyển mang lại data mart say mê hợp.


Sandboxes: Sandboxes là các khu vực riêng tư, bảo mật, an ninh cho phép những công ty xét nghiệm phá nhanh chóng và không bao gồm thức những bộ tài liệu mới hoặc những cách phân tích dữ liệu mà không cần thiết phải tuân thủ hoặc tuân hành các quy tắc với giao thức chấp thuận của kho dữ liệu.

Sự cải cách và phát triển của Data Warehouse

Khi những kho tài liệu lần thứ nhất xuất hiện tại vào cuối những năm 1980, mục tiêu của bọn chúng là giúp tài liệu chuyển từ các hệ thống quản lý và vận hành sang các hệ thống cung cấp quyết định DSS. Gần như kho dữ liệu lúc đầu này đòi hỏi một lượng lớn dự phòng. đa số các tổ chức có không ít môi ngôi trường DSS giao hàng những người tiêu dùng khác nhau. Tuy vậy các môi trường DSS thực hiện nhiều dữ liệu giống nhau, việc thu thập, có tác dụng sạch cùng tích hợp dữ liệu thường được xào nấu cho từng môi trường.

Khi những kho dữ liệu trở nên công dụng hơn, bọn chúng đã trở nên tân tiến từ các kho thông tin cung cấp nền tảng BI truyền thống lịch sử thành các cơ sở hạ tầng so sánh rộng rãi cung ứng nhiều nhiều loại ứng dụng, ví dụ như phân tích chuyển động và cai quản hiệu suất. Việc tái diễn kho dữ liệu đã tiến triển theo thời gian để mang về giá trị tăng thêm gia tăng đến doanh nghiệp.

Ngày nay, AI và máy học đang chuyển đổi hầu hết hồ hết ngành, thương mại & dịch vụ và gia sản doanh nghiệp với Data Warehouse cũng ko ngoại lệ. Việc không ngừng mở rộng dữ liệu lớn và vận dụng các technology kỹ thuật số new đang thúc đẩy sự biến đổi về các yêu mong và tài năng của kho dữ liệu.


Các kho dữ liệu hòa bình là bước đi mới nhất trong vượt trình tăng cấp này, cung cấp các doanh nghiệp tài năng trích xuất giá bán trị to hơn từ dữ liệu trong những khi giảm giá thành và nâng cao độ tin yêu và hiệu suất kho dữ liệu.

Cloud Data Warehouse là gì?

Cloud Data Warehouse sử dụng đám mây nhằm nhập và tàng trữ dữ liệu từ những nguồn dữ liệu khác nhau.

Các kho dữ liệu ban sơ được phát hành với những máy nhà tại chỗ. Những kho dữ liệu ở đây tiếp tục có không ít lợi ráng ngày nay. Trong không ít trường hợp, chúng có thể nâng cấp khả năng cai quản trị, bảo mật, hòa bình dữ liệu với độ trễ tốt hơn. Mặc dù nhiên, kho tài liệu tại khu vực không giãn nở bằng và bọn chúng yêu cầu dự báo tinh vi để xác minh cách mở rộng kho dữ liệu cho các yêu cầu trong tương lai. Việc cai quản các kho dữ liệu này cũng rất có thể rất phức tạp.

Mặt khác, một số ưu điểm của Cloud Data Warehouse bao gồm:

Hỗ trợ teo giãn, không ngừng mở rộng quy mô cho những yêu cầu tàng trữ hoặc đo lường và tính toán lớn hoặc rứa đổ.Dễ sử dụng.Dễ quản lí lý.Tiết kiệm đưa ra phí.

Các kho dữ liệu đám mây cực tốt được làm chủ hoàn toàn, bảo đảm rằng trong cả những tín đồ mới bước đầu cũng hoàn toàn có thể tạo và áp dụng kho tài liệu chỉ cùng với một vài ba cú nhấp chuột. Một cách thuận lợi để ban đầu di gửi sang Cloud Data Warehouse là chạy kho dữ liệu đám mây của bạn tại chỗ, phía sau tường lửa trung tâm dữ liệu tuân hành các yêu cầu về độc lập và bảo mật dữ liệu.

Ngoài ra, phần nhiều các kho dữ liệu đám mây những tuân theo quy mô và trả tiền khi sử dụng, giúp tiết kiệm thêm chi phí cho khách hàng hàng.

Modern Data Warehouse là gì?

Cho mặc dù họ là thành viên của group CNTT, chuyên môn dữ liệu, phân tích kinh doanh hay kỹ thuật dữ liệu, những người dân dùng khác nhau trong tổ chức mong muốn khác nhau về kho dữ liệu.

Một phong cách xây dựng dữ liệu hiện đại xử lý những yêu cầu khác nhau bằng phương pháp cung cấp cho một cách để quản lý toàn bộ các nhiều loại dữ liệu, khối lượng công việc, với phân tích. Bao hàm các mẫu bản vẽ xây dựng với những thành phần quan trọng được tích hợp để làm việc cùng mọi người trong nhà theo các cách thức hay độc nhất trong ngành. Modern Data Warehouse bao gồm:

Cơ sở dữ liệu quy tụ giúp đơn giản dễ dàng hóa việc thống trị tất cả các loại tài liệu và cung cấp các cách không giống nhau để thực hiện dữ liệu.Dịch vụ nhập và biến hóa dữ liệu trường đoản cú phục vụ.Nhiều tùy lựa chọn phân tích góp bạn dễ dàng sử dụng tài liệu mà ko cần di chuyển dữ liệu.Quản lý auto để cung cấp, mở rộng quy mô cùng quản trị 1-1 giản.

Xem thêm: Estimation Là Gì ? Định Nghĩa, Ví Dụ, Giải Thích Estimate Là Gì

Một kho dữ liệu hiện đại hoàn toàn có thể hợp lý hóa quy trình các bước dữ liệu một cách tác dụng theo cách mà các kho không giống không làm được. Điều này tức là tất cả gần như người, từ các nhà phân tích và kỹ sư tài liệu đến các nhà khoa học dữ liệu và team CNTT, có thể thực hiện công việc hiệu quả hơn và theo đuổi các bước đổi bắt đầu đưa tổ chức tiến lên mà không có sự lừ đừ và phức tạp.