The aim of this research is to compare the accuracy of a rule induction classifier system –Quinlan’s SEE5– with linear discriminant analysis and logit. The classification task chosen is the differentiation of the most efficient companies from the least efficient ones on the basis of a set of financial variables. The sample consists of a database containing the annual accounts of the companies located in the Principality of Asturias (Spain), which are mainly small businesses. The main results indicate that SEE5 outperforms logit, but it is not clearly better than discriminant analysis. However, SEE5 models suffer from bigger increases in error rates when tested with validation samples. Another interesting finding is that in SEE5 systems both the number of variables selected and the number of rules inferred grow when sample size increases.
El objetivo de esta investigación es comparar la precisión de un sistema de clasificación por reglas inductivas (SEE5, de Quinlan) con discriminación de análisis y logística. La tarea de clasificación elegida es la diferenciación entre las compañías más y menos eficientes en base a una serie de variables financieras. La muestra consiste en una base de datos que contiene las cuentas anuales de las compañías localizadas en el Principado de Asturias (España), que mayormente se trata de negocios pequeños. Los principales resultados indican que SEE5 supera la logística, pero no es claramente mejor que un análisis discriminatorio. Sin embargo, los modelos SEE5 padecen un aumento en los ratios de error cuando se prueban con muestras de validación. Otro hallazgo interesante es que en los sistemas SEE5 tanto el número de variables seleccionadas como el número de reglas inferidas aumentan cuando el tamaño de la muestra es mayor.