Phần 16: Histogram – Matplotib Basic
Histogram là sự phân bố dữ liệu số. Nó ước lượng phân phối xác suất của 1 biến liên tiếp và là 1 dạng biểu đồ thanh.
Để tạo biểu đồ, hãy thực hiện theo những bước sau:
- Bin phạm vi giá trị.
- Chia tất cả phạm vi giá trị thành 1 loạt các khoảng.
- Đếm xem có bao nhiêu giá trị rơi vào mỗi khoảng.
Các bins thường được chỉ định là các khoảng liên tiếp, không chồng chéo của 1 biến.
Hàm matplotlib.pyplot.hist () vẽ 1 biểu đồ, tính toán và vẽ biểu đồ của x.
Tham số :
Bảng sau liệt kê các tham số cho histogram:
x | mảng hay chuỗi các mảng |
---|---|
bins | số nguyên hay chuỗi hay ‘auto’, tùy chọn |
Thông số tùy chọn
vary | Phạm vi dưới và trên của bin |
---|---|
density | Nếu như true, phần tử đầu tiên của bộ giá trị trả về sẽ là số đếm được chuẩn hóa để tạo nên mật độ xác suất |
cumulative | Nếu như true, thì biểu đồ được tính toán trong đó mỗi thùng cung cấp số lượng trong thùng đó cộng cùng tất cả các thùng cho những giá trị nhỏ hơn |
histtype | Loại histogram để vẽ. Mặc định là ‘bar’ |
Ví dụ sau vẽ biểu đồ về điểm của các sinh viên trong 1 lớp học. 4 thùng, 0-25, 26-50, 51-75 và 76-100 được xác định. Biểu đồ cho ta thấy số học sinh rơi vào phạm vi này.
from matplotlib import pyplot as plt
import numpy as np
fig,ax = plt.subplots(1,1)
a = np.array([22,87,5,43,56,73,55,54,11,20,51,5,79,31,27])
ax.hist(a, bins = [0,25,50,75,100])
ax.set_title("histogram of outcome")
ax.set_xticks([0,25,50,75,100])
ax.set_xlabel('marks')
ax.set_ylabel('no. of scholars')
plt.present()
Cốt truyện xuất hiện như hình bên dưới đây –