Mô hình tạo sinh

Trong phân loại bằng thống kê, có hai cách tiếp cận chính là tiếp cận tạo sinh (sinh mẫu) và tiếp cận phân biệt. Hai cách này tính toán các bộ phân lớp (classifier) bằng nhiều cách khác nhau, tùy theo mức độ của mô hình thống kê. Thuật ngữ đặt tên cho các mô hình này không nhất quán,[a] nhưng ba loại chính có thể được phân biệt đó là Jebara (2004):

Việc phân biệt giữa hai lớp cuối cùng này không được thực hiện một cách nhất quán;[2] Jebara (2004) đề cập đến ba loại này là học tạo sinh, học điều kiện, và học phân biệt, nhưng Ng & Jordan (2002) chỉ phân biệt hai loại, gọi chúng là các phân lớp tạo sinh (phân phối đồng thời) và các phân lớp phân biệt (phân phối có điều kiện hoặc không có phân phối), không phân biệt giữa hai lớp sau.[3] Tương tự, một bộ phân lớp dựa trên một mô hình tạo sinh là một phân lớp tạo sinh, trong khi một bộ phân lớp dựa trên một mô hình phân biệt là một phân lớp phân biệt, mặc dù thuật ngữ này cũng đề cập đến các bộ phân lớp không dựa trên một mô hình.

Xem thêm

  • iconCổng thông tin Toán học

Chú thích

  1. ^ Three leading sources, Ng & Jordan 2002, Jebara 2004, and Mitchell 2015, give different divisions and definitions.

Tham khảo

  1. ^ Ng & Jordan (2002): "Generative classifiers learn a model of the joint probability, p ( x , y ) {\displaystyle p(x,y)} , of the inputs x and the label y, and make their predictions by using Bayes rules to calculate p ( y | x ) {\displaystyle p(y|x)} , and then picking the most likely label y.
  2. ^ Jebara 2004, 2.4 Discriminative Learning: "This distinction between conditional learning and discriminative learning is not currently a well established convention in the field."
  3. ^ Ng & Jordan 2002: "Discriminative classifiers model the posterior p ( y | x ) {\displaystyle p(y|x)} directly, or learn a direct map from inputs x to the class labels."

Liên kết ngoài

  • Shannon, C. E. (1948). “A Mathematical Theory of Communication” (PDF). Bell Labs Technical Journal. 27 (July, October): 379–423, 623–656. doi:10.1002/j.1538-7305.1948.tb01338.x. hdl:10338.dmlcz/101429. Bản gốc (PDF) lưu trữ ngày 6 tháng 6 năm 2016. Truy cập ngày 25 tháng 1 năm 2021.
  • Mitchell, Tom M. (2015). “3. Generative and Discriminative Classifiers: Naive Bayes and Logistic Regression” (PDF). Machine Learning.
  • Ng, Andrew Y.; Jordan, Michael I. (2002). “On discriminative vs. generative classifiers: A comparison of logistic regression and naive bayes” (PDF). Advances in Neural Information Processing Systems.
  • Jebara, Tony (2004). Machine Learning: Discriminative and Generative. The Springer International Series in Engineering and Computer Science. Kluwer Academic (Springer). ISBN 978-1-4020-7647-3.
  • Jebara, Tony (2002). Discriminative, generative, and imitative learning (PhD). Viện Công nghệ Massachusetts. hdl:1721.1/8323., (mirror Lưu trữ 2020-01-13 tại Wayback Machine, mirror), published as book (above)
  • x
  • t
  • s
  • Outline of statistics
  • List of statistics articles
Continuous probability distribution
Central tendency
Statistical dispersion
Shape of a probability distribution
Count data
  • Index of dispersion
Summary tables
  • Grouped data
  • Frequency distribution
  • Contingency table
Hệ số tương quan
  • Pearson correlation coefficient
  • Rank correlation
    • Spearman's rank correlation coefficient
    • Kendall rank correlation coefficient
  • Partial correlation
  • Scatter plot
Statistical graphics
  • Bar chart
  • Biplot
  • Box plot
  • Control chart
  • Correlogram
  • Fan chart (statistics)
  • Forest plot
  • Histogram
  • Pie chart
  • Q–Q plot
  • Run chart
  • Scatter plot
  • Stem-and-leaf display
  • Radar chart
  • Violin plot
Design of experiments
Survey methodology
  • Sampling (statistics)
    • Stratified sampling
    • Cluster sampling
  • Standard error
  • Opinion poll
  • Questionnaire
Thí nghiệm
  • Scientific control
  • Randomized experiment
  • Randomized controlled trial
  • Random assignment
  • Blocking (statistics)
  • Interaction (statistics)
  • Factorial experiment
Adaptive Designs
  • Adaptive clinical trial
  • Up-and-Down Designs
  • Stochastic approximation
Observational study
  • Cross-sectional study
  • Cohort study
  • Natural experiment
  • Quasi-experiment
Statistical theory
  • Quần thể thống kê
  • Hoạt động thống kê
  • Phân phối xác suất
  • Sampling distribution
    • Order statistic
  • Empirical distribution function
    • Density estimation
  • Mô hình thống kê
    • Statistical model specification
    • Lp space
  • Statistical parameter
    • Location parameter
    • Scale parameter
    • Shape parameter
  • Parametric statistics
    • Likelihood function Monotone likelihood ratio
    • Location–scale family
    • Exponential family
  • Completeness (statistics)
  • Thống kê đủ
  • Plug-in principle
    • Bootstrapping (statistics)
    • U-statistic
    • V-statistic
  • Optimal decision
  • Efficiency (statistics)
  • Statistical distance
    • Divergence (statistics)
  • Asymptotic theory (statistics)
  • Robust statistics
Frequentist inference
Point estimation
  • Estimating equations
  • Bias of an estimators
    • Minimum-variance unbiased estimator
      • Rao–Blackwell theorem
      • Lehmann–Scheffé theorem
    • Median-unbiased estimator
  • Plug-in principle
Interval estimation
  • Khoảng tin cậy
  • Pivotal quantity
  • Likelihood interval
  • Prediction interval
  • Tolerance interval
  • Resampling (statistics)
    • Bootstrapping (statistics)
    • Jackknife resampling
Kiểm định giả thuyết thống kê
  • One- and two-tailed tests
  • Power of a test
    • Uniformly most powerful test
  • Permutation test
    • Resampling (statistics)
  • Multiple comparisons problem
Parametric statistics
  • Likelihood-ratio test
  • Score test
  • Wald test
Specific tests
  • Z-test
  • Student's t-test
  • F-test
Goodness of fit
Rank statistics
  • Sign test
    • Sample median
  • Wilcoxon signed-rank test
    • Hodges–Lehmann estimator
  • Mann–Whitney U test
  • Nonparametric statistics Analysis of variance
    • Kruskal–Wallis one-way analysis of variance
    • Friedman test
    • Jonckheere's trend test
Suy luận Bayes
Hệ số tương quan
  • Pearson correlation coefficient
  • Partial correlation
  • Confounding
  • Coefficient of determination
Phân tích hồi quy
  • Errors and residuals
  • Regression validation
  • Mixed model
  • Simultaneous equations models
  • Multivariate adaptive regression spline
Hồi quy tuyến tính
  • Simple linear regression
  • Ordinary least squares
  • General linear model
  • Bayesian linear regression
Non-standard predictors
Generalized linear model
  • Exponential family
  • Logistic regression / Binomial regression / Poisson regressions
Partition of sums of squares
  • Analysis of variance
  • Analysis of covariance
  • Multivariate analysis of variance
  • Degrees of freedom (statistics)
Categorical variable / Multivariate statistics / Chuỗi thời gian / Survival analysis
Categorical variable
Multivariate statistics
Chuỗi thời gian
General
  • Decomposition of time series
  • Linear trend estimation
  • Stationary process
  • Seasonal adjustment
  • Exponential smoothing
  • Cointegration
  • Structural break
  • Granger causality
Specific tests
Time domain
  • Autocorrelation
    • Partial autocorrelation function
  • Cross-correlation
  • Arma
  • Box–Jenkins method
  • ARCH
  • Vector autoregression
Frequency domain
Survival analysis
Survival function
  • Kaplan–Meier estimator
  • Proportional hazards models
  • Accelerated failure time model
  • First-hitting-time model
Failure rate
  • Nelson–Aalen estimator
Test
  • Logrank test
List of fields of application of statistics
Biostatistics
Engineering statistics
  • Chemometrics
  • Methods engineering
  • Probabilistic design
  • Statistical process control / Kiểm soát chất lượng
  • Reliability engineering
  • System identification
Social statistics
Spatial analysis
  • Thể loại[[::Thể loại:Thống kê]]
  • '
  • Trang CommonsCommons:Category:Statistics
  • Dự án Wiki Wikipedia:WikiProject Statistics