Efectos a largo plazo de PROSPERA en el Bienestar ∗ Arturo Aguilar† Cristina Barnard‡ Giacomo De Giorgi§ Enero de 2019 Resumen Los efectos a largo plazo del programa de transferencias condicionales de México, PROSPERA, en los hogares pobres son de gran interés tanto para los responsables de la formulación de políticas como para los académicos. Este trabajo analiza los efectos a largo plazo en el bienestar de los hogares participantes originales y de sus descendientes, aproximadamente 20 años después del inicio del programa. Para complementar otros estudios que analizan los efectos en educación y salud, este análisis se centra en una definición utilitaria del bienestar y emplea dos estrategias empíricas para el análisis. La primera, utiliza el experimento de 1997-2000 como la fuente de variación más limpia, si bien es limitada. El análisis muestra que, para 2017-2018, los descendientes de las familias beneficiarias originales tienen mayor probabilidad de formar sus propios hogares, de emigrar a diferentes localidades y de tener más bienes duraderos y gasto en consumo que su contraparte de control. La segunda estrategia confirma y amplía estos hallazgos con el uso de una metodología de diferencias en diferencias que emplea la expansión del programa en las localidades y la edad de los individuos, como fuente de variación. Este segundo enfoque abarca una muestra mucho más amplia y representativa, y se capta información sobre vulnerabilidad autorreportada respecto al consumo de alimentos. Los resultados confirman el pronóstico positivo general en lo que respecta a bienes duraderos y menor vulnerabilidad alimentaria. Quizá lo más interesante y relevante para evaluar el éxito del programa consiste en que mejoró la movilidad intergeneracional. Con el uso del experimento de 1997-2000, el análisis muestra que los adultos jóvenes beneficiados mejoraron en términos de educación, posesión de bienes e ingresos con respecto a sus padres. Parece que los descendientes de los beneficiarios originales están mejorando su posición relativa en cuanto a bienes e ingresos. Palabras clave: PROSPERA, Programa Social, Largo Plazo, Bienestar. Códigos JEL: I38, O12, O15 Este documento es parte del proyecto de investigación “Estudios de resultados de largo plazo de PROSPERA” que fue financiado por el Gobierno de México a través de la Coordinación Nacional de Prospera (CNP) como parte de un acuerdo de cooperación técnica con el Banco Mundial (BM). El equipo del Banco Mundial agradece al Gobierno de México, incluyendo a la a la Secretaría de Desarrollo Social (ahora Secretaría de Bienestar), a la Secretaría de Educación Pública y a la Secretaría de Salud por la colaboración cercana en este proyecto de investigación, incluyendo la provisión de las principales bases de datos. El equipo del Banco Mundial también quiere agradecer al Consejo Nacional de Evaluación de la Política de Desarrollo Social (CONEVAL), al Instituto Nacional de Salud Pública, al Banco Interamericano de Desarrollo y a los investigadores nacionales e internacionales que contribuyeron en el Grupo Asesor de Evaluación. Este grupo fue establecido para garantizar la calidad técnica y el rigor metodológico de los “Estudios de resultados de largo plazo de PROSPERA.” Estos estudios fueron coordinados por María Concepción Steta, Especialista Sénior de Protección Social – BM; Clemente Ávila, Economista de Protección Social – BM; y Mónica Orozco, Consultora - BM. ∗Agradecemos al equipo del Banco Mundial, los comentarios de Orazio Attanasio, Curtis Huffman, Petra Todd, Mercedes González de la Rocha y Margaret Grosh, así como a los participantes de diversos talleres. †ITAM ‡ITAM § GSEM - Universidad de Ginebra, MOVE, BGSE, UAB, BREAD, CEPR, IPA 1 I Introducción El análisis a largo plazo del programa mexicano de transferencias monetarias condicionadas (TMC), PROSPERA, constituye un recurso muy importante, tanto para los responsables de la formulación de políticas como para los académicos. El mundialmente famoso programa mexicano TMC PROSPERA (anteriormente llamado PROGRESA y Oportunidades), con su enfoque en la inversión en capital humano en términos de salud y educación, ha inspirado varios programas en todo el mundo y ha moldeado la forma en que investigadores, responsables de la formulación de políticas y políticos interactúan para implementar y evaluar grandes políticas públicas.1 Ir más allá del análisis de corto plazo permitirá entender si los impactos inmediatos se traducen en beneficios a largo plazo, no solo para las familias beneficiarias originales, sino también, y más importante, para sus descendientes. Este análisis es fundamental, ya que uno de los principales objetivos del programa es romper el ciclo intergeneracional de pobreza en el que las condiciones de los padres actuaban como uno de los obstáculos principales para el éxito de sus hijos. Esto significaría un logro enorme para cualquier política pública y, como tal, merecería un gran nivel de atención. En este trabajo, estudiamos los efectos a largo plazo del programa al dar respuestas a las siguientes preguntas: 1. ¿El programa mejoró el bienestar a largo plazo de los participantes? 2. ¿Contribuyó el programa a romper el ciclo de pobreza de los participantes y de sus descendientes (movilidad intergeneracional)? Responder a estas preguntas no es una tarea sencilla. El primer reto es conceptual, ya que el concepto de bienestar está lejos de estar determinado de manera inequívoca.2 Atkinson (2011) y Deaton (2018) recientemente reavivaron un debate de hace décadas sobre la manera correcta de definir y medir un concepto tan impreciso. Sen (1970, 1973, 1986, 2006) ha jugado un papel importante en este debate al cuestionar un enfoque utilitario del bienestar y, en lugar de ello, promover un enfoque de capacidades basado en la idea de que los resultados o decisiones (observables por el investigador) presentan una imagen incompleta del bienestar real del individuo. La extensa literatura que estudia los beneficios de PROSPERA ha analizado diferentes dimensiones de la vida de los individuos y las familias, abarcando el tema de bienestar desde diferentes perspectivas. Este estudio está limitado en ese sentido. Decidimos centrarnos en un enfoque del bienestar basado en el consumo, más acorde con el concepto utilitario. 1Elanexo A proporciona una descripción general del programa. 2Las referencias a la definición conceptual del bienestar no pretenden ser exhaustivas, únicamente tienen la intención de presentar una pequeña muestra del extenso trabajo de estos notables autores sobre el tema. 2 La perspectiva utilitaria del bienestar se justifica por el hecho de que, desde la perspectiva de la teoría económica, el consumo suele ser el principal insumo en las funciones de utilidad.3 Si bien se hace un esfuerzo por emplear una definición más amplia de bienestar que la que se basa únicamente en el consumo y la oferta laboral, este análisis se complementa con otros artículos que se están elaborando como parte de este conjunto de estudios, los cuales analizan efectos en educación, salud y movilidad ocupacional. Además, al momento de redactar el presente artículo, la disponibilidad de los datos supone una limitante. Se sugiere que investigaciones futuras contemplen indicadores adicionales a medida que se disponga de más información. El enfoque del bienestar basado en el consumo que se utiliza en este estudio se centrará en la adquisición de bienes duraderos, al tiempo que propone una medida (imputada) de consumo no duradero (alimentos, productos personales y prendas de vestir). Esto se justifica por el hecho de que el consumo refleja el nivel de ingreso permanente de los hogares y su resiliencia ante las crisis (Deaton y Zaidi 2002). Además, el consumo refleja las condiciones de vida de los hogares de mejor manera que los ingresos. De hecho, esto explica por qué la focalización de PROSPERA utilizó un índice proxy basado en los bienes duraderos de los hogares y en las características de sus miembros para identificar a los hogares vulnerables (Skoufias et al. 2001). Más adelante, se analizarán los resultados del mercado laboral de aquellos individuos a los que el programa alentó cuando eran niños para que permanecieran inscritos en la escuela. Finalmente, para analizar la transmisión intergeneracional de la pobreza, se estudian medidas de movilidad en los rankings de percentiles, como en Chetty et al. (2014), de los resultados seleccionados. Nuestra definición de movilidad es bastante estándar en la literatura y se centra en la comparación de la posición relativa de los resultados de los individuos con respecto a la de sus padres. En la práctica, esto significa que los datos se organizan en orden ascendente, considerando las magnitudes del resultado de interés para padres e hijos por separado; este orden proporciona la posición relativa en la distribución correspondiente. Posteriormente, se compara la posición relativa de los padres con respecto a la de los hijos. Si tienen exactamente la misma posición, no hay movilidad entre generaciones; en cambio, se observa movilidad ascendente si los descendientes mejoran su posición relativa respecto a la de sus padres. La mayor movilidad ocurre si la posición hijos no está relacionada con la posición de sus padres. En el mejor de los casos, se debería observar que al (i) permitir que las familias se aseguren contra las crisis temporales, (ii) elevar los ingresos a niveles más altos y estables, y (iii) invertir en capital tanto físico como humano (educación y salud), el programa puede generar un ciclo virtuoso. Esto se puede reflejar en la inversión y la mejora de los resultados para los beneficiarios y sus descendientes, lo que podría sacar a las generaciones futuras de la pobreza. Se pospone a trabajos futuros el estudio de otros aspectos y enfoques sobre el análisis del bienestar, a reserva 3Por ejemplo, en la motivación por el premio Nobel otorgado a Angus Deaton en 2015: ...El consumo de bienes y servicios es un determinante fundamental del bienestar humano https://www.nobelprize.org/nobel prizes/economic-sciences/laureates/2015/advanced-economicsciences2015.pdf. 3 de que este estudio ya contempla una estrategia multifacética que incluye diversos indicadores (véase por ejemplo Ravallion (2011)), y mediciones de privación social, como las sugeridas por el Consejo Nacional de Evaluación de la Política de Desarrollo Social (CONEVAL).4 El segundo desafío que enfrentamos es metodológico. Cabe señalar que gran parte del presente análisis se centra en los efectos a largo plazo del diseño experimental original; esta estrategia de identificación es la más limpia, sin embargo, implica limitaciones importantes. Esencialmente, la variación experimental ofrece una diferencia entre el tratamiento temprano y tardío. Esta dicotomía sólo representa poco más de un año de transferencias adicionales para el grupo tratado, o alrededor de un 9 % de recursos adicionales disponibles durante el primer periodo del experimento, ya que el grupo de control comenzó a recibir transferencias justo después de la finalización del experimento inicial. Por lo tanto, este diseño consiste en mayor medida en un margen intensivo que en uno extensivo.5 En cierto modo, los efectos estimados podrían entenderse como límites inferiores para los efectos reales de un tratamiento extensivo y, por lo tanto, cualquier efecto positivo debe interpretarse como un éxito del programa, dada la limitada variación disponible. Es importante destacar que también se implementa un diseño de investigación alternativo que permite acercarse más al ejercicio de comparación entre el tratamiento y un control puro; en dicho enfoque se utiliza la expansión secuencial del programa y las edades de los individuos para identificar el efecto de varios años de tratamiento en comparación con la condición de nunca haber recibido tratamiento directamente, ya que los niños mayores de 16 años al momento de la introducción de la política no estarían expuestos directamente a ella (o, en cualquier caso, estarían expuestos en menor medida, ya que es poco probable que cumplan con el requisito de edad para los componentes condicionales). Los principales efectos de PROSPERA pueden resumirse de la siguiente forma: i) familias recién creadas, es decir, aquellas formadas por los hijos de las familias beneficiarias originales, experimentan un aumento importante de sus compras de bienes duraderos, en particular, de artículos de cocina y entretenimiento, así como gastos en consumo no duradero (imputado); ii) las familias originales no parecen tener un aumento importante de bienes duraderos; iii) las nuevas familias tienden a ubicarse en localidades diferentes a aquellas donde sus integrantes vivían en 1997 (normalmente, las localidades en las que nacieron). Estos resultados son consistentes con el hecho de que los hijos de las familias originales son los beneficiarios directos del capital humano adicional, en salud y en educación, debido al programa; por lo tanto, parecen estar en una ruta de desarrollo a largo plazo diferente a la de su contraparte de 4Véase https://goo.gl/aQ8MPt 5El margen intensivo se refiere a la comparación de recibir más con respecto a recibir menos. En cambio, el margen extensivo se refiere a una comparación entre recibir una intervención y no recibirla. En este contexto, el grupo que inicialmente se definió como el de control, comenzó a recibir los beneficios del programa en 1999. Por lo tanto, la comparación entre el grupo de tratamiento y el de control debe interpretarse como aquella en la que el grupo de tratamiento recibió más recursos (9 % más transferencias en total) debido a que su inscripción en el programa fue más temprana (por poco más de un año). Esto explica por qué asumimos que nuestra comparación consiste en margen intensivo. 4 control. En particular, se observa que los mayores efectos en bienestar se concentran en los individuos en la muestra con mayores efectos en acumulación de capital humano inicial: aquellos que estuvieron a punto de abandonar la escuela secundaria en 1997/98, es decir, los que tenían entre 11 y 16 años. Es necesario recordarle al lector que el experimento utilizado para esta parte del análisis se llevó a cabo entre 1998 y 1999. Por lo tanto, si bien es posible que haya grandes mejoras en los niños muy pequeños (por ejemplo, de 0 a 5 años en este análisis), esto se haría evidente en términos de bienes para cuando su acumulación de capital humano termine, lo que no es posible observar en este ejercicio. De hecho, al analizar una fuente de datos adicional y se proporcionar un diseño de investigación complementario, en la Sección V.B, se observa que los efectos de PROSPERA son generalmente mayores para los individuos beneficiados desde etapas de desarrollo temprano. En términos de movilidad intergeneracional y del ciclo de vida, se observa que los adultos jóvenes que formaron sus propias familias tienen mejores resultados que sus padres, en términos de escolaridad, bienes e ingresos, cuando se comparan con sus contrapartes de control. Estos resultados son muy alentadores, ya que coinciden con el objetivo de la política pública. Un programa como PROSPERA debe, en última instancia, permitir que la siguiente generación progrese y ascienda en la pirámide social, para romper así el ciclo de pobreza. Finalmente, para estimar los beneficios de PROSPERA a lo largo de su existencia, se proporciona un cálculo aproximado basado en Gertler et al. (2012). Se calculan los efectos en el gasto en consumo no duradero de los hogares tratados en 1997-1999, comparándolos con el grupo de control que no recibió ninguna transferencia en ese periodo. Dicho ejercicio estima un efecto de alrededor del 25 %, por equivalente de adulto, sobre el consumo de referencia en 1997 (a precios de 2017). El resto del estudio incluye una revisión seleccionada de la literatura (Sección II); una descripción de los mecanismos potenciales a través de los cuales el programa puede tener impactos a largo plazo en las vidas de las familias originales y en las de sus hijos (Sección III); una descripción detallada de los datos utilizados (Sección IV), y las estrategias empíricas empleadas (Sección V). Más adelante, se presentan los resultados en la Sección VI, y, finalmente, se concluye en la Sección VII. 5 II Revisión de la literatura Con el fin de identificar la aportación de este trabajo en la ya extensa literatura sobre PROSPERA, se mencionarán a continuación los estudios más relevantes en los que se basa este análisis. Es importante mencionar que existen varios estudios que analizan los efectos a corto y mediano plazo del programa sobre diferentes resultados de interés para este análisis. Está fuera del alcance de este estudio presentar una lista exhaustiva de todas las publicaciones que durante las últimas dos décadas han analizado el programa, por lo que nos enfocaremos en una selección de estudios cercanamente relacionados con el presente análisis. A pesar de la extensa literatura, muy pocos estudios han analizado los aspectos específicos del éxito a largo plazo en los que este trabajo se centra, en este sentido, se considera que este análisis es complementario al conocimiento acumulado a lo largo de los años en dos aspectos principales: i) el enfoque de bienestar de este estudio se basa en una definición estándar del comportamiento de compra/consumo; ii) el interés no sólo en los efectos a largo plazo de la política a 20 años del inicio del programa, sino más importante, en el análisis de la siguiente generación o en los hijos de las familias originales que han participado en el programa desde que se creó. Por ejemplo, hay una serie de estudios sobre el impacto de la política en los perfiles de consumo de los beneficiarios (Hoddinott y Skoufias 2004) y los no beneficiarios (Angelucci y De Giorgi 2009 y Angelucci et al., 2017). Estos estudios encuentran evidencia robusta del aumento en el consumo de bienes no duraderos (principalmente alimentos) y, en menor medida, de bienes duraderos, tanto para familias beneficiarias como para otros miembros de la familia que viven en la misma localidad que los beneficiarios de la transferencia directa. Cabe señalar que Angelucci et al. (2017) analizan si esos efectos positivos persisten a mediano plazo, definido en su estudio como seis años transcurridos desde las transferencias iniciales. Existe una literatura más limitada sobre los impactos a largo plazo de PROSPERA y, en general, sobre los estudios de efectos a largo plazo de los programas de TMC. Millan et al. (2018) presenta un resumen reciente de estudios que investigan los efectos a largo plazo de estas políticas. Entre los ejemplos relevantes se encuentran los siguientes: análisis de los efectos a largo plazo en capital humano (Barham et al. (2017) en Nicaragua); de forma similar, Báez y Camacho (2011) estudian los efectos a largo plazo de las TMC de Colombia (Familias en Acción) en el capital humano; se presentan análisis similares en Barrera-Osorio et al. (2017) y Aizer et al. (2016) sobre la longevidad, el nivel educativo, el estado nutricional y los ingresos de los niños en la edad adulta en los EE. UU. También existe literatura que analiza diversos aspectos de las transferencias: condicionadas frente a no condicionadas (Baird et al., 2011; Bursztyn y Coffman, 2012), focalizadas frente a universales (Niehaus et al., 2013), así como otros aspectos de la transferencias (Haushofer y Shapiro, 2016). Sin embargo, determinar la relevancia de los diferentes aspectos del programa está fuera del alcance del presente análisis. 6 En el caso de Progresa/Oportunidades/PROSPERA, Behrman et al. (2011), Gertler et al. (2012) y Angelucci et al. (2017) analizan los efectos a mediano plazo en consumo, capital humano y en comportamiento respecto a inversión. Posteriormente, Kugler y Rojas (2018) estudian los efectos a largo plazo en capital humano y resultados del mercado laboral para la población experimental original. Además, recientemente Parker y Vogl (2018) se centraron en los niños de las familias beneficiarias originales y descubrieron efectos positivos en capital humano, activos, vivienda y resultados del mercado laboral. Finalmente, Adhvaryu et al. (2018) estudian cómo PROSPERA protegió a niños contra las crisis de las primeras etapas de la vida, lo que les permitió evitar crisis potenciales a largo plazo. III Mecanismos potenciales Potencialmente existen muchos canales a través de los cuales PROSPERA podría cambiar las vidas de beneficiarios y no beneficiarios. El objetivo de esta sección es presentar una teoría de cambio sencilla en lugar de una descripción detallada de los posibles mecanismos a través de los cuales PROSPERA podría tener efectos a largo plazo. Potencialmente existen muchos canales, mismos que dependen de si se analizan las familias beneficiarias originales o sus hijos, de modo que una explicación detallada quedaría fuera del alcance de este estudio. Sin embargo, este estudio se basa en el trabajo de otros autores para plantear un enfoque propio y analizar resultados. Como es bien sabido, el programa se diseñó para abordar diversos aspectos de la pobreza y cómo salir de ella. En concreto, el programa abordó la educación, la salud y la nutrición a través de transferencias y condicionalidades. Por lo tanto, resulta inmediato considerar que debe existir un canal virtuoso directo que pase por la acumulación de capital humano para los niños de familias originales. Un mayor nivel de capital humano mejoraría la forma de vida del grupo tratado de manera estable. En 2017/2018, los hijos de los beneficiarios originales ya son adultos, y gracias a una mayor escolaridad y mejor salud, pueden ser más productivos y obtener mayores ingresos. El aumento en los ingresos permanentes y en el capital humano se traduciría, por lo tanto, en mejores niveles de vida. Se confirmará en el presente documento que, en efecto, PROSPERA aumentó el capital humano, en términos de escolaridad y salud de los hijos de las familias iniciales. Sin embargo, existen otros canales potenciales importantes que van desde i) la acumulación de activos, ii) la ocupación y iii) el emprendedurismo. Existe bastante evidencia sobre los efectos positivos en los resultados educativos y de salud (Todd y Wolpin 2006; Angelucci et al. 2010; Bobonis 2009; Lalive y Cattaneo 2009; Attanasio et al. 2012; Parker y Vogl 2018) tanto para beneficiarios como para no beneficiarios. También, se ha presentado evidencia sobre las elecciones ocupacionales y el comportamiento de inversión 7 (Bianchi y Bobba 2010; Gertler et al. 2012; Angelucci et al. 2017). Adicionalmente, el programa ha demostrado tener efectos en la movilidad ocupacional (Yaschine 2012), en el empoderamiento de la mujer y los procesos de toma de decisiones en el hogar (Attanasio y Lechene 2002, Attanasio y Lechene 2014, Bobonis et al. 2015). Toda la literatura mencionada afirma que los miembros de los hogares originales cuentan un mayor nivel de educación y parecen haber acumulado más activos productivos, así como iniciado actividades comerciales productivas. El consenso general que surge de la literatura es que PROSPERA ha logrado mejoras importantes en el corto y mediano plazo como resultado de un mayor capital humano, flujos de ingresos más estables e inversiones rentables en activos y ocupaciones. Este estudio se basa en toda la evidencia existente mencionada para justificar los efectos a largo plazo y los efectos intergeneracionales en los indicadores de bienestar considerados. En general, el ahorro y, por lo tanto, la inversión, pueden aumentar debido a un mayor ingreso disponible y a la reducción de la incertidumbre general de los hogares beneficiarios. Ingresos más elevados pueden permitir inversiones que antes eran imposibles, al tiempo que una menor incertidumbre en cuanto a los flujos de ingresos futuros reduce la necesidad de ahorros preventivos o improductivos, y permite que los hogares asuman más riesgos en proyectos de negocios (Banerjee y Duflo, 2011). Del mismo modo, las personas con un mayor nivel de educación podrían tomar mejores decisiones de consumo a largo plazo. Las familias beneficiarias que antes sufrían graves limitaciones crediticias pueden ahora empezar a ahorrar y hacer inversiones a largo plazo, incluyendo inversiones en sus hijos. Reconocemos que todos estos canales, y algunos otros, podrían funcionar al mismo tiempo. Si bien se analizarán algunos canales cuando sea relevante, intentar descomponer los efectos generales en cada canal no es el propósito del presente estudio. En cambio, nos enfocamos en estimar el efecto general del programa en diferentes mediciones que reflejan mayor bienestar. Realizar este análisis es empíricamente desafiante dado que la variación original del experimento proporciona solo un pequeño margen de exposición diferencial. En este estudio se abordarán dos aspectos de dicha exposición diferencial: primero, el hecho de que los hogares en localidades experimentales reciben mayor cantidad agregada y exposición temporal a los recursos transferidos por el programa; segundo, en algunas partes del análisis se relacionará lo anterior con la variación por cohortes, lo que ofrece una exposición diferencial en etapas de desarrollo cruciales. Dos ejemplos significativos son: las etapas educativas en las que son frecuentes altos niveles de deserción escolar (especialmente entre los beneficiarios más pobres) y las etapas tempranas esenciales de desarrollo infantil. En ambos casos, la literatura sobre el programa ya ha proporcionado evidencia favorable. 8 IV Datos Se emplean dos fuentes de información para el análisis que aquí se presenta: (1) los datos panel de PROSPERA recopilados desde 1997 hasta 2017-2018 (sobre un subconjunto de localidades e individuos), para la evaluación del experimento inicial y (ii) los datos intercensales de 2015 recopilados por el Instituto Nacional de Estadística y Geografía (INEGI). IV.A Panel de la ENCEL de PROSPERA Como es ampliamente conocido, en 1997 se seleccionó una muestra de 24,077 hogares en 506 localidades rurales para implementar una prueba controlada aleatorizada (RCT, por sus siglas en inglés) con el fin de aportar evidencia rigurosa sobre los efectos de PROSPERA (conocido como Progresa en ese tiempo).6 Este conjunto de localidades, elegidas siguiendo los lineamientos del programa, se asignaron a un grupo de tratamiento (320 localidades) y a uno de control (186 localidades), donde los hogares elegibles en el grupo de tratamiento recibieron el apoyo de PROSPERA. Las transferencias se distribuyeron a partir del otoño de 1998 a aquellos hogares elegibles que cumplieron con las reglas establecidas en el programa, mientras que las localidades de control comenzaron a recibir el mismo tratamiento a finales de 1999. A esta muestra se le dio seguimiento a través de una encuesta de hogares llamada ENCEL en 1998, 1999, 2000, 2003 y 2007 a fin de ofrecer evidencia de los impactos del programa a corto y mediano plazo. En un esfuerzo por proporcionar datos relevantes para evaluar los efectos de PROSPERA a largo plazo, el Banco Mundial, PROSPERA y el Instituto Nacional de Salud Pública (INSP) se asociaron para reunir información en 2017-2018 sobre un subconjunto de esa muestra de participantes. Marco de muestreo de la ENCEL 2017-2018. Dadas las restricciones presupuestarias y la complejidad para realizar el seguimiento de los participantes originales, que fue la estrategia de las rondas anteriores del panel, se seleccionó una submuestra de 334 localidades de las 506 localidades originales.7 Como se muestra en el Panel A de la Tabla 1 , este primer filtro implicó la selección de hogares elegibles más ricos en localidades menos marginadas. Se visitó cada una de las localidades seleccionadas y los encuestadores buscaron los 18,564 hogares incluidos en la muestra de 1997 que vivían en esas localidades. La estrategia de selección empleada al inicio del programa para seleccionar a los beneficiarios estableció a 12,519 de estos hogares como elegibles. 6Al inicio del programa, se les dio prioridad a las localidades rurales. En México, las localidades rurales se definen como aquellas con menos de 2,500 habitantes. 7Se seleccionaron las localidades más accesibles y, como resultado, la ENCEL 2017-2018 incluye a las localidades más ricas dentro de la muestra completa original de 506 localidades. Un conjunto de localidades que se agregaron en la ronda de 2003 no están incluidas en el marco de muestreo para la ronda de 2017-2018. 9 El análisis se enfocará en este conjunto de hogares, ya que proporcionan la variación relevante para el análisis.8 Se les dio prioridad a los hogares que tenían miembros jóvenes al inicio de la recopilación de datos (1997-2000). En total, se identificaron 7,824 hogares elegibles en la recopilación de datos de 2017-2018. A partir de aquí, se hará referencia a ellos como hogares originales, debido a que su muestreo se llevó a cabo en 1997. El panel B de la Tabla 1 muestra la atrición derivada de la imposibilidad de localizar algunos de los hogares originales en las 334 localidades seleccionadas. Los hogares más grandes con más activos tienen mayor probabilidad de ser encuestados en 2017. De manera importante, y fundamental para la validez interna de los efectos estimados, se muestra que la atrición general descrita resulta ortogonal al tratamiento (véase la Tabla 2). Este último resultado es alentador en cuanto a identificación causal de los efectos del tratamiento; sin embargo, se debe mencionar que esos efectos podrían no ser aplicables a toda la población de interés. A pesar de esta preocupación, suponemos que el marco muestral adoptado probablemente subestima o proporciona estimaciones moderadas de los efectos, ya que la muestra abarca hogares con mejores condiciones iniciales, por lo que probablemente los efectos del programa sean menores para esos hogares. A continuación, mediante el uso de una lista de todos los individuos de los hogares originales de 1997, los encuestadores solicitaron información sociodemográfica sobre cada uno de ellos, así como sobre los nuevos miembros que vivían en el hogar (estos serían los descendientes u otras personas que se integraron al hogar después de la ronda de encuestas de 1997). Entre el conjunto original de individuos, se diseñó una encuesta separada para los miembros que estaban en grupos de edad cruciales en el momento en que se inició el programa. Se definieron tres grupos de edad de interés: (i) recién nacidos en 1997-2000, ya que se encontraban en una etapa fundamental de desarrollo cuando inició el RCT; (ii) niños de 6 a 8 años en 1997-2000, ya que estaban a punto de inscribirse en los grados escolares en los que las condicionalidades del programa son más relevantes; y (iii) niños en sexto grado en 1997-2000, ya que los efectos positivos del programa en términos de matriculación escolar parecen estar concentrados en este crucial grado escolar. Es importante destacar que los niños de los hogares originales en las localidades de interés podrían seguir viviendo en los hogares originales, pero también podrían haberse mudado para formar un nuevo hogar (o unirse a uno ya existente). Se registró la información de contacto para rastrear a estos individuos. Este proceso de búsqueda tuvo una limitación geográfica: sólo se intentaron realizar entrevistas con los individuos que se mudaron fuera del hogar original si se asentaban en la misma localidad que el hogar original, en un área cercana a la localidad 8Los hogares no elegibles pudieron haberse inscrito después en el programa. Sin embargo, comparar los hogares no elegibles de las comunidades de tratamiento y de control implicaría seleccionar hogares que inicialmente no recibieron el programa y que no se vieron influenciados por la asignación aleatoria del tratamiento. 10 del hogar original9 o en las tres principales áreas metropolitanas de México (Ciudad de México, Monterrey y Guadalajara). Como se mencionó anteriormente, los hogares en los que se encontraban estas personas podían ser hogares recién formados (por ejemplo, los individuos casados o que decidieron mudarse por su cuenta) o bien hogares que ya existían a los que el individuo decidió mudarse (por ejemplo, mudarse con familiares). Para efectos de este análisis, todos estos hogares se definen como hogares nuevos, en el sentido de que no existían en la muestra de 1997. Los encuestadores pudieron localizar y entrevistar a 4,987 individuos en los grupos de edad relevantes: 2,105 de ellos seguían viviendo en sus hogares de origen y los 2,882 restantes habitaban en hogares nuevos. De las individuos habitando en un hogar nuevo, 4,207 entrevistas no fueron exitosas, ya sea porque se mudaron a un hogar no accesible dada la cobertura geográfica de la encuesta, porque no se encontró a las personas en la dirección indicada a los encuestadores o por falta de respuesta. Además, se encuestó erróneamente a una submuestra de 1,994 individuos fuera de los grupos de edad de interés.10 En nuestro análisis utilizamos todos los individuos muestreados. La Tabla 3 ofrece más detalles sobre las diferentes posibilidades de atrición de la muestra. En esta tabla se utiliza un modelo logit para relacionar las características de la línea de base del hogar con la probabilidad de atrición. Las columnas pares añaden la interacción de las características de la línea de base con la dummy de tratamiento para explorar más a fondo la posibilidad de atrición selectiva. En las columnas (1) a (4) se presenta evidencia sobre la atrición de los hogares originales, que son la base del diseño muestral. Las columnas (1) y (2) dan evidencia de la selección por localidad (igual que en la Tabla 1 Panel A) mientras que las columnas (3) y (4) muestran la posibilidad de encontrar a todos los hogares originales en las 334 localidades seleccionadas. Como muestran estas columnas, es más probable que no haya sido posible encuestar a los jefes de familia de más edad de los hogares más pequeños. Esto es consistente con la evidencia presentada en la Tabla 1, donde no se encuentra evidencia de atrición selectiva. Finalmente, las columnas (5) y (6) incluyen la atrición de los hogares nuevos. Dado que estos hogares no existían en 1997, su atrición se basa en la posibilidad de encontrar miembros en los grupos de edades relevantes que se mudaron fuera del hogar original. En este sentido, la atrición resulta de los 4,207 miembros que se buscaron y no se encontraron. La sección VI.A.3 realiza un ejercicio de robustez en el que se emplean ponderaciones de probabilidad inversa para ajustar por atrición. 9Dadas las restricciones presupuestarias, se realizaron búsquedas de los hogares en las localidades situadas a 30 minutos en automóvil como máximo. 10Estos individuos añadidos por error no son una submuestra aleatoria de todos los individuos fuera del grupo de interés, sino que corresponden a aquellos para los que la edad no estaba disponible en 1997-2000 y se confundieron con los recién nacidos. 11 Tabla 1: Tabla de atrición. Panel A: Baja selectiva geográfica Panel B: Baja selectiva por respuesta Media Media Variables de 1997 Localidades Localidades Dif. Valor p Sin respuesta Muestra Dif. Valor p fuera muestra Características del jefe de familia Mujer* 0.0898 0.0828 -0.0069 0.3419 0.1040 0.0579 -0.0462 0.0000 Edad 43.1787 42.1468 -1.0319 0.0447 43.6988 40.3251 -3.3737 0.0000 Años de escolaridad 2.6100 2.7620 0.1520 0.2534 2.6030 2.9477 0.3447 0.0000 Ingreso y actividades productivas HA de tierras productivas 1.7881 1.6975 -0.0906 0.5711 1.6422 1.7628 0.1206 0.1872 log (PC del ingreso mensual del H) 5.0339 4.9582 -0.0758 0.0706 5.0624 4.8391 -0.2233 0.0000 H. Características y bienes Piso de tierra* 0.7661 0.7365 -0.0296 0.2382 0.7619 0.7066 -0.0553 0.0000 Electricidad* 0.4855 0.6107 0.1252 0.0066 0.5680 0.6612 0.0932 0.0000 10 Refrigerador* 0.0324 0.0417 0.0093 0.3416 0.0385 0.0456 0.0071 0.0904 Televisión* 0.2762 0.3048 0.0285 0.2921 0.2661 0.3504 0.0843 0.0000 Posesión de animales de tiro* 0.3488 0.3308 -0.0180 0.4476 0.2970 0.3707 0.0738 0.0000 Demografía del hogar Tamaño del hogar 5.6965 5.9663 0.2699 0.0006 5.2133 6.8556 1.6423 0.0000 Núm. de niños 0-7 1.5602 1.6790 0.1188 0.0090 1.3172 2.1057 0.7885 0.0000 Núm. de niños 8-17 1.6560 1.7773 0.1213 0.0041 1.4641 2.1471 0.6830 0.0000 Núm. de adultos 70+ 0.1314 0.1006 -0.0308 0.0020 0.1264 0.0701 -0.0563 0.0000 Características de las localidades Índice de marginación de 0.7229 0.6272 -0.0957 0.2985 0.6643 0.5833 -0.0809 0.0309 localidades 1995 Núm. de observaciones 2,718 9,801 5,307 4,494 Prueba global: Estadístico F = 2.02; valor p = 0.128 Prueba global: Estadístico F = 80.04 valor p < 0.0000 * Variable dummy. Esta tabla muestra la baja selectiva basada en la restricción geográfica establecida para seleccionar la muestra y la capacidad de encontrar los hogares originales a partir de la muestra de la ENCASEH de 1997. El balance de las variables mostradas se calcula con los datos de la ENCASEH de 1997. Errores estándar agrupados a nivel de localidad. Los asteriscos indican nivel de significancia del ***1 %, **5 % y *10 %. Tabla 2: Tabla de balance. Medio Variables de 1997 Control Tratamiento Dif valor p Características del jefe de familia Mujer* 0.0571 0.0583 0.0012 0.8868 Edad 40.5610 40.1865 -0.3745 0.4146 Años de escolaridad 2.8088 3.0293 0.2205 0.1457 Ingreso y actividades productivas Núm. de ha de tierras 1.7492 1.7708 0.0215 0.9048 productivas log (PC del ingreso mensual del 4.8815 4.8130 -0.0685 0.1003 H) H. Características y bienes Piso de tierra* 0.7271 0.6945 -0.0326 0.2831 Electricidad* 0.6679 0.6572 -0.0106 0.8239 Refrigerador* 0.0463 0.0452 -0.0011 0.9262 Televisión* 0.3751 0.3359 -0.0392 0.2528 Animales de tiro* 0.3518 0.3818 0.0301 0.3222 Demografía del hogar Tamaño del hogar 6.8539 6.8566 0.0027 0.9770 Núm. de niños 0-7 2.1263 2.0936 -0.0327 0.5062 Núm. de niños 8-17 2.1323 2.1558 0.0235 0.6716 Núm. de adultos > 70 0.0692 0.0706 0.0015 0.8689 Características de las localidades 0.6748 0.5296 -0.1452 0.1352 Índice de marginación de 1995 Núm. de observaciones 1,663 2,831 * Variable ficticia Esta tabla prueba el balance en características observables entre el tratamiento y control iniciales del RCT de PROSPERA con esta muestra. Las observaciones se limitan a los hogares que se encontraron en la ENCEL 2017-2018 y que se emplearon en estas estimaciones principales. El balance de las variables mostradas se calcula con los datos de la ENCASEH de 1997. Errores estándar agrupados a nivel de localidad. Los asteriscos indican significación en el nivel del ***1 %, **5 % y *10 %. 11 Información disponible. Tanto para los hogares originales como para los nuevos, las características de la vivienda y la información sobre los bienes duraderos se recopilaron a nivel del hogar, se utiliza dicha información para explorar los impactos a largo plazo de PROSPERA sobre el bienestar. A los individuos en los grupos de edad relevantes se les hicieron varias preguntas adicionales sobre temas relacionados con sus ingresos y situación laboral. Una limitación importante de los datos de la ENCEL 2017 es que el consumo no duradero (en particular, el consumo de alimentos) no está disponible. Esto limita el análisis del bienestar, especialmente en un contexto de población pobre, en el que el gasto en alimentos representa una elevada proporción del total de los gastos. Sin embargo, como ejercicio adicional, se propone una medida imputada sobre el gasto de consumo no duradero, que incluye alimentos, productos personales y ropa, adaptando de la metodología de Blundell et al. (2005) y Attanasio y Pistaferri (2016) a los datos disponibles (véase el anexo C). Es importante recordar al lector que, si bien los artículos de consumo duradero suelen ser costosos, su compra es poco frecuente, y para los hogares pobres el gasto total en bienes duraderos suele ser de alrededor del 20 % del gasto total, por lo que resulta relevante analizar el gasto no duradero. La Tabla 4 proporciona estadísticas descriptivas de los hogares originales y nuevos, empleados en el presente análisis utilizando datos de 1997 y 2017. Para los hogares nuevos, la información de 1997 corresponde a la de su respectivo hogar de origen. La comparación entre 1997 y 2017 muestra un aumento de los niveles de educación, mayores niveles de ingresos, mayor acumulación de activos; los hogares originales envejecieron y se componen principalmente de adultos; los hogares nuevos son más jóvenes en general (tanto en términos de edad de los jefes de familia como de composición de los miembros). Curiosamente, la proporción de jefas de familia aumenta considerablemente.11 Varias razones explican este cambio: las mujeres son las receptoras de las transferencias, lo que significa que los hogares monoparentales tenderían a ser liderados por una mujer, de igual manera, al preguntar por el jefe de familia 20 años después del programa, la probabilidad de nombrar a una mujer (al menos al encuestador) es mayor; con el paso del tiempo, son más comunes las mujeres viudas que los hombres viudos; y, finalmente, ante la separación de un matrimonio, es más probable que la mujer se quede con los hijos y los recursos del programa. 11Es importante indicar que estas proporciones de jefas de familia se observan para los hogares elegibles. 12 Tabla 3: Tabla de atrición. Hogares originales Hogares nuevos distribución 1997 distribución 2017 distribución 2017 (1) (2) (3) (4) (5) (6) Índice de marginación de loc. 0.099 -0.052 -0.001 0.053 -0.021 0.155 (0.071) (0.126) (0.076) (0.141) (0.061) (0.123) Mujer jefa de familia† 0.033 0.017 0.083 0.030 0.179 0.521*** (0.085) (0.144) (0.092) (0.164) (0.112) (0.192) Edad del jefe de familia 0.020*** 0.023*** 0.022*** 0.025*** 0.008*** 0.015*** (0.002) (0.003) (0.002) (0.003) (0.003) (0.004) Años de escolaridad del jefe de -0.006 0.007 -0.005 0.005 0.002 0.001 familia (0.011) (0.017) (0.010) (0.016) (0.012) (0.021) Jefe de familia indígena† -0.085 0.041 0.206** 0.120 0.125 -0.206 (0.087) (0.158) (0.086) (0.157) (0.084) (0.169) Tamaño del hogar -0.31*** -0.31*** -0.37*** -0.37*** -0.02 -0.01 (0.016) (0.027) (0.020) (0.035) (0.017) (0.026) Índice de bienes -0.044* -0.054 -0.011 0.020 0.015 -0.001 (0.024) (0.042) (0.022) (0.039) (0.022) (0.038) Piso de tierra† 0.061 0.078 0.035 0.184 0.092 0.012 (0.070) (0.126) (0.068) (0.118) (0.070) (0.120) Posesión de tierras productivas† 0.032 -0.121 0.013 -0.165 0.109 0.011 (0.064) (0.110) (0.057) (0.104) (0.069) (0.125) Núm. de niños 8-17 0.056*** 0.084*** 0.068*** 0.100*** 0.042* 0.039 (0.019) (0.030) (0.022) (0.036) (0.024) (0.038) Tratamiento (T)† 0.005 0.138 -0.032 0.422 0.021 0.348 (0.098) (0.284) (0.089) (0.298) (0.080) (0.340) T x índice de marginación de loc. 0.236 -0.078 -0.245* (0.156) (0.164) (0.141) T x jefa mujer 0.017 0.084 -0.534** (0.179) (0.198) (0.234) T x edad del jefe de familia -0.005 -0.006 -0.010* (0.004) (0.004) (0.006) T x años de escolaridad del jefe -0.020 -0.016 -0.000 de familia (0.022) (0.021) (0.025) T x jefe de familia indígena -0.180 0.122 0.468** (0.192) (0.186) (0.192) T x tamaño de hogar -0.001 -0.013 -0.012 (0.034) (0.042) (0.034) T x índice de bienes 0.015 -0.050 0.019 (0.052) (0.047) (0.046) T x piso de tierra -0.025 -0.221 0.116 (0.152) (0.143) (0.147) T x posesión de tierras 0.250* 0.281** 0.144 productivas (0.134) (0.123) (0.149) T x núm. de niños 8-17 -0.042 -0.051 0.011 (0.039) (0.045) (0.048) Constante 1.408*** 1.329*** 1.268*** 0.976*** -0.101 -0.286 (0.150) (0.223) (0.139) (0.240) (0.173) (0.270) T x interacciones (valor p) 0.678 0.331 0.075 Observaciones 12,163 12,163 9,635 9,635 6,905 6,905 Media 0.641 0.641 0.541 0.541 0.607 0.607 Esta tabla muestra la relación entre la baja, basada en la capacidad de encontrar los hogares originales de la muestra de la ENCASEH 1997, y las características de los hogares y las localidades medidas en la línea de base con los datos de la ENCASEH 1997 (columnas 1 a 4). Las columnas 3 y 4 solo incluyen los hogares de las localidades muestreadas en la ENCEL 2017. En las columnas 5 y 6, la baja se define en función de la capacidad de encontrar miembros jóvenes que formaron su propio hogar. Errores estándar agrupados a nivel de localidad. † indica una variable dummy. Los asteriscos indican nivel de significancia del ***1 %, **5 % y *10 %. 13 Tabla 4: Estadísticas descriptivas. Hogares Originales Hogares Nuevos 1997 2017 1997 2017 Características del jefe de familia Mujer* 0.06 0.26 0.06 0.13 Edad 40.33 56.82 41.00 31.25 Años de escolaridad 2.95 3.33 2.88 7.76 Ingreso log (PC del ingreso mensual del H) 4.84 7.35 4.85 7.14 Características y bienes del H Piso de tierra* 0.71 0.14 0.69 0.13 Electricidad* 0.66 0.98 0.66 0.97 Refrigerador* 0.05 0.66 0.04 0.56 Televisión* 0.35 0.83 0.36 0.82 Demografía del H Tamaño del hogar 6.86 2.47 7.34 3.84 Núm. de niños 0-7 años 2.11 0 2.26 1.08 Núm. de niños 8-17 años 2.15 0 2.38 0.66 Núm. de niños 18-34 años 1.35 0.73 1.46 1.62 Núm. de niños 35-54 años 0.967 0.86 1.01 0.39 Núm. de niños 55-69 años 0.194 0.67 0.20 0.04 Núm. de adultos 70+ años 0.070 0.17 0.07 0.02 Características de las localidades Índice de marginación (1995) 0.58 0.58 Observaciones 4,494 2,265 * Variables dummy. Esta tabla muestra estadísticas descriptivas de las variables a nivel de familia e individual que se utilizarán para construir las principales variables dependientes, así como los controles que se utilizarán en las principales especificaciones. Los datos provienen de: (i) la ENCASEH 1997, que corresponde a los datos de referencia para el experimento de Progresa y (ii) la ENCEL 2017-2018, que es la última ronda del panel del experimento. 14 IV.B Encuesta Intercensal del INEGI 2015 Una segunda parte del análisis que se detallará en la siguiente sección utiliza la encuesta intercensal 2015, recopilada por el INEGI.12 Esta encuesta se recopila a la mitad del periodo entre los levantamientos subsecuentes de los censos y contiene información sobre ingresos, educación, características de la vivienda, la propiedad de bienes duraderos y medidas de vulnerabilidad del consumo (entre otros temas). Esta encuesta incluye información de los individuos en más de 6 millones de hogares de todas las municipalidades mexicanas. El acceso a estos datos con identificadores geográficos restringidos se obtuvo a través del Laboratorio de Microdatos del INEGI.13 El análisis se centra en los individuos de 0 a 21 años en 1997-2000, ya que estos individuos tenían la mayor exposición potencial a PROSPERA. En total, se utilizan para el análisis datos de 1,875,039 individuos en todas las localidades (urbanas y rurales) de 24 estados mexicanos.14 Es importante destacar que el uso de esta fuente de datos permite examinar directamente las medidas de la inseguridad y la resiliencia del consumo de alimentos, al tiempo que permite una definición más precisa del estado del tratamiento, como se explicará más adelante. Al mismo tiempo, con esta muestra mucho mayor, también se pueden validar los resultados obtenidos de las fuentes de datos anteriores, en una muestra representativa de la población mexicana.15 12Disponible en https://goo.gl/5EMD7e 13Por razones de confidencialidad, el INEGI no divulga los identificadores geográficos de las localidades con menos de 15,000 habitantes. Los investigadores llenaron una solicitud para acceder a esta información que es crucial para la identificación utilizada. 14La selección de los estados mexicanos para el análisis se basó en el hecho de que se identificó visualmente un salto discontinuo en la selección de las localidades. Los estados que quedaron fuera incluyen a Aguascalientes, Baja California, Colima, Chihuahua, Ciudad de México, Morelos, Nayarit y Yucatán. 15Aunque la exclusión de la Ciudad de México podría parecer perjudicial para la representatividad de la muestra, es importante recordar que la extensión urbana del programa no ocurrió hasta el 2004. En ese momento quedaba poca variación de inclusión geográfica, misma que es la principal estrategia de identificación aquí empleada. 15 V Estrategia Empírica V.A Análisis Mediante el Uso del Panel ENCEL PROSPERA Efectos a largo plazo. Para la identificación de los efectos a largo plazo de PROSPERA, primero nos basamos en el experimento tipo RCT de 1997-2000, que proporciona la fuente de variación más limpia disponible. Sin embargo, dado que las localidades controladas de control empezaron a recibir el programa alrededor de dos años después del inicio del Progresa (es decir, a finales de 1999), esta estrategia debe interpretarse como un tratamiento temprano versus tardío o como una intensidad de tratamiento derivada de los meses adicionales de transferencias que recibió el grupo tratado inicial. La Tabla 5 muestra que los hogares originales en localidades de tratamiento temprano reciben un monto acumulado 8.8 % mayor de transferencias, durante 6.6 pagos bimestrales adicionales. Sin embargo, estos recursos adicionales no se distribuyen uniformemente durante el período de 20 años entre el inicio del programa y 2017, sino que se concentran en 1998-1999. Tabla 5: Transferencias monetarias condicionadas. (1) (2) (3) log(Transferencias log(Transferencias Pagos totales totales) potenciales) Panel A: Hogares originales Tratamiento 0.088** 0.062*** 6.60*** (0.0358) (0.0053) (0.971) Constante 11.17*** 11.37*** 92.11*** (0.0958) (0.0170) (2.728) Observaciones 4,494 4,494 4,494 R cuadrado 0.105 0.794 0.039 Media T 2017 12.29 12.66 106.92 Media C 2017 12.20 12.60 100.59 Panel B: Hogares nuevos Tratamiento 0.091** 0.055*** 5.83*** (0.0449) (0.00730 (1.198) Constante 11.34*** ) 100.20*** (0.131) 11.42*** (3.606) (0.0250) Observaciones 2,265 2,265 2,265 R cuadrado 0.118 0.807 0.037 Media T 2017 12.36 12.71 107.65 Media C 2017 12.28 12.67 102.03 Esta tabla muestra las implicaciones directas de la variable de tratamiento aleatorio en relación con las transferencias de efectivo recibidas al inicio del programa (1998-1999). Los resultados utilizados son los siguientes: (i) Transferencias totales, que corresponde al monto acumulado de transferencias recibidas por los hogares (en pesos mexicanos reales); (ii) Transferencias potenciales, que se refiere al monto de transferencias que, dadas las reglas del programa, acumularía un hogar si hubiera un cumplimiento perfecto; y (iii) Pagos totales, que indica la cantidad total de pagos que una familia ha recibido desde que se inscribió en el programa. Esta información proviene de los registros administrativos del programa. El tratamiento es una variable dummy que identifica si la observación se realiza en una de las 320 localidades de tratamiento originales del RCT de Progresa. Los controles incluyen (de la ENCASEH 1997): Edad, educación y uso de un dialecto del jefe de familia, tamaño del hogar, % de miembros menores de 15 años, dummies para la propiedad de casa, tierras productivas y animales de tiro, e índice de marginación de la localidad. Errores estándar agrupados a nivel de localidad. Los asteriscos indican nivel de significancia del ***1 %, **5 % y *10 %. 16 Ya que se utiliza el diseño inicial del RCT para el análisis, la estimación de los efectos de interés es bastante simple y consiste en las siguientes especificaciones: Yij = τ0 + τ1 Tj + X´ij(1997)β + Uij (1) Yijt = α0 + α1 Tj + α2 1{2017t} + α3 1{2017t} ∗ Tj + X´ij(1997)α4 + Dijt (2) Yij(2017) = β0 + β1 Tj + β2Yij(1997) + X´ij(1997)β3 + Eij (3) donde Tj es una dummy que identifica a aquellas familias que viven en una localidad de tratamiento temprano (j), determinado aleatoriamente; Xij es un conjunto de controles a nivel hogar (i) y localidad (j).16 Para proporcionar evidencia sobre la robustez de las estimaciones se presentan los resultados utilizando las tres regresiones anteriores. En la ecuación (1) se emplea un enfoque de diferencia transversal simple, donde el parámetro de interés es τ1. En particular, este enfoque es útil ya que ciertos indicadores (artículos y servicios de TI) no se recopilan en la base de referencia. Sin embargo, incluso si no se registran resultados específicos en la base de referencia, se podrían implementar otros dos enfoques que sustituyan la información faltante de la base de referencia por elementos duraderos que estén correlacionados con los que faltan (por ejemplo, el conjunto completo de bienes duraderos). En la ecuación (2) se utiliza un enfoque estándar de diferencias en diferencias, donde el parámetro de interés es α3 que describe el excedente de variación en los resultados entre el tratamiento y el control donde 1{2017t} es una variable dummy que indica si la observación corresponde al levantamiento de 2017. La ecuación (3) se conoce comúnmente como una especificación ANCOVA que permite cierta flexibilidad adicional con respecto a las DID (Diferencias en diferencias) y es más apropiada desde un punto de vista inferencial. En esta última especificación el parámetro de interés es β1, mientras que Yij(1997) indica el valor del resultado en la base de referencia (1997) (véase McKenzie 2012). 16Aunque se tiene una muestra más pequeña que las 506 localidades iniciales, como se explica más detalladamente en la sección IV, se aseguró que la atrición en las distintas localidades no sea diferente según el estatus de tratamiento y se volvió a hacer una prueba de balance mediante la muestra disponible. La Tabla 2 en el anexo muestra que los hogares de tratamiento y controlados aún están equilibrados. 17 Ciclo de vida y efectos intergeneracionales. Para el análisis del ciclo de vida y de los efectos intergeneracionales de PROSPERA se emplea una modificación de la ecuación 3, como es estándar en esta literatura, relacionando los resultados de la base de referencia (para el hogar original cuando es apropiado) con los resultados de la encuesta ENCEL 2017-2018. Se exploran los efectos sobre la movilidad a lo largo de generaciones y según el estatus de tratamiento mediante la siguiente especificación: ∆ Yij = η0 + η1 Tj + η2 Y (G1)ij(1997) + η3 Y (G1)ij(1997) Tj + Xijj(1997)η4 + Qij (4) donde ∆ Yij = Y (G2)ij(2017) −Y (G1)ij(1997) proporciona el cambio en el resultado a través del tiempo para los niños con respecto a sus padres. Y (G2)ij(2017) es el resultado de la siguiente generación o de los hogares nuevos (denotado con G2) observado en 2017, mientras que Y(G1)ij(1997) es el resultado de sus padres (G1) observado en el momento que el programa estaba a punto de comenzar: la base de referencia (ENCASEH 1997). El coeficiente η2 es esencialmente uno menos el coeficiente de persistencia intergeneracional, ya que indica la estabilidad de los resultados entre generaciones. En esta formulación el interés tanto η1 como η3 resultan relevantes, ya que el primero es el efecto basal de la política con respecto a los individuos o familias de control mientras que η1 + η3 es el parámetro correspondiente para los tratados de forma temprana. Si se toma la ecuación (4) y se remplaza Y (G2)ij(2017) con Y(G1)ij(2017) (resultado de los padres observado en 2017), η1 y η3 darían información sobre los efectos del ciclo de vida para el grupo de tratamiento. De acuerdo con Chetty et al. (2014), en este análisis se emplea como resultado la posición relativa del hogar mediante el percentil de tres medidas diferentes: escolaridad, un índice de activos duraderos e ingreso. Cada percentil se calcula dentro de grupos formados por rangos de edades de 10 años. V.B Análisis Mediante el Uso de la Encuesta Intercensal Para evitar la pequeña ventana que ofrece la identificación del tratamiento temprano versus tardío, se complementa el análisis anterior con una estrategia de diferencias en diferencias (DID) que explota diferencias en la expansión del programa y en los diferentes grupos de edad de los individuos. Para este propósito, se crean cuatro grupos de localidades basados en su año de inscripción en PROSPERA: i) E1, que indica las localidades que se inscribieron en 1997-1998; ii) E2, que corresponde al ingreso en 1999-2001; iii) E3, que se refiere a las localidades que ingresaron en 2002-2005; y iv) E4, que identifica las localidades que ingresaron después de 2006. La comparación entre la inscripción temprana y la tardía implica recibir más transferencias, pero si se combina con la edad de un individuo, también puede dar diferentes incentivos basados en la condicionalidad de la escolaridad. Además, para aquellos individuos cuya edad está por encima del umbral para recibir las transferencias de PROSPERA en el momento en que su localidad entra en el programa, esto también significa que nunca serán tratados directamente. 18 Como las localidades más pobres fueron en general las primeras en ser tratadas, la comparación entre los diferentes grupos formados según la fecha de adscripción al programa tendría un problema de sesgo por selección. Siguiendo el trabajo de Duflo (2001) y Parker y Vogl (2018), comenzamos por ocuparnos del problema de selección mediante el uso de diferentes cohortes. Las cohortes representan el tiempo de exposición de un individuo al programa cuando se interactúan con la expansión del programa. Se forman cuatro cohortes con las edades de los individuos en 2001: (C1) 0-5 años, que corresponde a los individuos que no habían comenzado la escuela primaria cuando su localidad se unió al programa. Sin embargo, si dicha adscripción fue en 1997- 1998, posiblemente los individuos en este grupo se beneficiaron en las primeras etapas de su desarrollo. (C2) 6-10 años, que corresponde a individuos más sensibles a la fecha de adscripción de su localidad, debido a las condicionalidades del programa. Por ejemplo, si la adscripción del programa se da (antes de 2002), los individuos en este grupo seguirían en la escuela primaria cuando su localidad entrara en el programa. Sin embargo, si el programa ingresa la localidad más tarde (por ejemplo, en 2006), es probable que los individuos en este grupo ya estén en secundaria. (C3) 11-16 años, que corresponde a individuos en etapas críticas de escolaridad: si el programa ingresa a su localidad temprano (antes de 2002), es probable que los individuos en este grupo estén en los años finales de la escuela primaria o principios de la secundaria, pero si ingresa tarde es probable que hayan superado esta etapa. Además, los individuos en este rango de edad tienen una alta probabilidad de estar en edad laboral en 2017-2018. (C4) 17-22 años, se considera como grupo de control, ya que, independientemente del año en que el programa ingrese a su localidad, ya habrían pasado las etapas críticas de escolaridad en términos de las condicionalidades de PROSPERA, por lo que nunca se tratarán directamente. La especificación para la estimación DID es: 3 4 3 4 Yij = θ0 + Σ θk Cki + Σ γq Eqj + Σ Σ τk,q Cki ∗ Eqj + Uij (5) k=1 q=2 k=1 q=2 donde Yij representa los resultados de 2015 para el individuo i de localidad j, Cki son las cohortes que se definieron con anterioridad, y Eqj son los grupos de las localidades basados en su año de adscripción (como se definió anteriormente). Los parámetros de interés son las τ, que corresponden a los estimadores DID. Por ejemplo, en los resultados se comparará τk,1, τk,2, y τk,3, que dan los efectos de los diferentes niveles de exposición al programa para una cohorte dada (k). En este caso, mantener como cohorte de referencia C4 significa que estas τ controlan por el sesgo de selección con la cohorte de referencia C4, que no se beneficia del programa 19 independientemente de su fecha de adscripción al programa. En trabajo futuro, nuestro objetivo es utilizar un diseño de regresión discontinua (RDD por sus siglas en inglés) para relajar aún más los supuestos de identificación en la expansión del programa. Por el momento se usa una estrategia que es similar, ya que utiliza grupos de edad contiguos y variación de exposición al programa usando su expansión, pero no es exactamente un RDD completo basado en una variable definitoria continua. La estrategia de RDD se basaría en el uso de un índice de marginalidad de la localidad para determinar las ubicaciones geográficas en las que el programa debía extenderse. La Figura 1 da evidencia de cómo el índice de marginalidad fue un determinante importante de la adscripción de las localidades al programa y como tal puede usarse para una estrategia de RDD. Figura 1: Primera etapa de RD con el uso del índice de marginalidad de la localidad. (a) 1999 (b) 2001 (c) 2004 (d) 2006 Estos gráficos muestran cómo el despliegue del programa a nivel de localidad utilizó como referencia el índice de marginalidad de 1995. Las reglas del programa establecieron vivir en una localidad rural pobre como primer paso para inscribirse en el programa. El nivel de pobreza se estableció utilizando el índice de marginalidad de 1995. Cada punto representa la proporción de localidades con un nivel dado del índice de marginalidad (agrupado en intervalos de 0.05) que se habían incluido en el programa en el año especificado. El punto de corte es distinto según la región geográfica. No todas las regiones geográficas muestran un cambio discontinuo en la proporción de localidades adscritas. Los autores realizaron un análisis para cada región (disponible a solicitud) y seleccionaron las localidades en las regiones geográficas que parecen seguir una regla de inclusión basada en el índice de marginalidad. Estos gráficos restringen las observaciones a las localidades seleccionadas. 20 VI Resultados VI.A Experimento Original Como se describió anteriormente, se comienza con el análisis de los efectos del tratamiento temprano versus tardío con el uso del diseño experimental original de 1997, que asignó 320 de 506 localidades para recibir las transferencias del gobierno a partir de 1998 y hasta finales de 1999. Se estiman las ecuaciones (1), (2) y (3) y se presentan los resultados en los paneles correspondientes de A a C de las Tablas 6 y 7. Se examinan los bienes duraderos, los gastos imputados no duraderos (alimentos, productos personales y ropa), además de los ingresos y la escolaridad, como resultados de interés para los hogares originales y nuevos, respectivamente, tal como se definieron en la sección IV. El presente estudio se enfoca en analizar el comportamiento del gasto duradero en línea con la perspectiva a largo plazo del informe general y el espíritu original del programa. VI.A.1 Hogares originales La Tabla 6 muestra que no hay diferencias significativas entre los hogares originales tratados y los hogares de control en la mayoría de los casos. Los indicadores empleados en el análisis son una agregación (conteo) de diferentes bienes duraderos; una agregación utilizando precios, sería problemática dada la gran variación en la calidad y la antigüedad de los bienes duraderos. Por lo tanto, se presenta un ejercicio de conteo considerando los siguientes bienes: (i) transporte, que se refiere al número de vehículos (automóviles, camionetas, motocicletas); (ii) entretenimiento, que incluye equipos de televisión, radio y sonido; (iii) utensilios de cocina, que suma el número de licuadoras, refrigeradores, microondas, estufas de gas o parrillas eléctricas; (iv) servicios básicos de vivienda, que identifican el hecho de tener piso firme, electricidad, drenaje y disponibilidad de agua en la propiedad; (v) bienes de tecnologías de la información (TI), que se refiere a computadoras y teléfonos celulares; y (vi) servicios de TI y de entretenimiento, que incluye teléfono de casa, Internet y televisión de paga.17 Se observa que algunos de los productos de TI y de TI y Entretenimiento no están disponibles en la base de referencia (1997). Por lo tanto, cuando se produce el análisis de dichos productos en las especificaciones DID y ANCOVA, se utiliza como base de referencia la total agregación de los bienes duraderos. En el Panel B de la Tabla 6 se realiza una estrategia de análisis basada en el excedente de crecimiento de los bienes duraderos en los hogares tratados frente a los controlados; mientras que en el Panel C se presenta una especificación ANCOVA estándar, es decir, se realiza una regresión de las variables de resultados en 2017 sobre el tratamiento y se controla por la misma variable de resultados correspondiente a la base de referencia. Los resultados sugieren que en general no hay diferencias para la base de referencia, lo que confirma que la aleatorización 21 inicial sigue siendo válida, y que la selección aleatoria de hogares para el último levantamiento presenta en general tasas de atrición no diferenciales, véanse los coeficientes correspondientes a la dummy de Tratamiento. Sin embargo, en algunos de los casos, la dummy de Tratamiento (resultado en 1997) muestra diferencias significativas, aunque negativas. Las diferencias que resultan del paso del tiempo (dummy de 2017) muestran que el acceso a los bienes ha mejorado mucho para todos los bienes, lo que no es de extrañar dado que los dos levantamientos están separados por 20 años, lo que indica una mejoría general en las condiciones de vida de los hogares originales. Finalmente, se observa una diferencia pequeña pero significativa en la variable de bienes de entretenimiento. No se observan efectos para el gasto en consumo no duradero. Diversas posibles explicaciones podrían justificar estos resultados. Primero, como ya se ha descrito, la definición de tratamiento considerada consiste en tener transferencias adicionales en el primer año del programa, lo cual ocurrió hace 20 años. Estos recursos adicionales podrían haber tenido un efecto a corto y mediano plazo, como han demostrado varios artículos y reportes. Sin embargo, es posible que este efecto no se haya mantenido hasta 2017. En segundo lugar, se están observando hogares que también existían en 1997, lo que significa que están compuestos predominantemente por miembros mayores en cuanto a edad, y que consideran cada vez más a mujeres como jefas de familia. Al estar enfocado principalmente en beneficiar a las próximas generaciones, PROSPERA podría producir menores impactos en este grupo de personas mayores. Tercero, la muestra podría no ser lo suficientemente grande como para permitir a los investigadores detectar diferencias estadísticamente significativas. En cuarto lugar, se están utilizando bienes duraderos que en el pasado se han utilizado para identificar a los hogares elegibles (pobres). Esto podría motivar a los encuestados a no responder con veracidad si creen que la encuesta podría utilizarse como parte del proceso de asignación.18 En quinto lugar, es notoriamente complejo analizar los gastos en bienes duraderos, ya que se trata de compras poco frecuentes con una amplia variación de calidad; los datos disponibles hasta ahora no incluyen los precios de dichas compras; además, los datos disponibles en esta etapa no incluyen mediciones de consumo no duradero o de consumo de alimentos directamente, por lo que se recurre a un método de imputación que tiene claras ventajas, pero también una serie de desventajas como cualquier otra imputación; el procedimiento de imputación se describe en la Apéndice C. En sexto lugar, los hogares originales podrían haber transferido a sus descendientes parte de sus bienes o ahorros y, por lo tanto, es posible que no se observe una diferencia positiva respecto a los hogares de control. Se debe tomar en cuenta que PROSPERA, por su diseño, se enfoca en los niños y, por lo tanto, es plausible que los principales efectos positivos a largo plazo se encuentren entre aquellos que fueron parte de la población objetivo 17También se puede solicitar un análisis de cada uno de ellos. 18Con cierta regularidad PROSPERA reúne una encuesta similar llamada ENCASEH, cuyo propósito es determinar si los hogares aún están en situación de pobreza y si deben permanecer o no en el programa. 22 de la política en términos de salud, nutrición y escolaridad. Los hogares originales podrían haber tenido un aumento inicial en sus ingresos, sin embargo, este aumento correspondiente al experimento original fue bastante limitado, de modo que eventualmente los hogares de control podrían haber alcanzado condiciones similares a las de los hogares del grupo de tratamiento. La situación puede ser diferente para los niños tratados, ya que algunos de los niños en el grupo de control, dada su edad y grado escolar, podrían no verse afectados en absoluto por la tardía expansión del programa en las localidades de control. Por ejemplo, los niños al margen de la deserción escolar que se encontraban en las localidades de control habrían abandonado la escuela, mientras que sus contrapartes de las localidades de tratamiento habrían permanecido en ella. Tabla 6: Efectos en la acumulación de bienes duraderos. Hogares originales. (1) (2) (3) (4) (5) (6) (7) Transporte Equipo de Utensilios de Servicios Artículos TI Servicios TI ln(cons imp) entr. cocina básicos Panel A: Transversal Tratamiento -0.023 0.011 -0.054 -0.002 -0.019 0.020 -0.011 (0.023) (0.044) (0.050) (0.048) (0.027) (0.036) (0.011) Constante 0.289*** 1.380*** 1.804*** 2.709*** 0.738*** 0.236*** 8.713*** (0.057) (0.099) (0.121) (0.088) (0.071) (0.075) (0.026) Observaciones 4,494 4,494 4,494 4,494 4,494 4,494 4,182 Panel B: DID 1997-2017 Tratamiento X 2017 0.006 0.098** 0.066 -0.068 0.082 0.127 0.014 (0.027) (0.049) (0.058) (0.077) (0.102) (0.107) (0.011) Tratamiento -0.017 -0.103** -0.106** 0.034 -0.158** -0.162** -0.023** (0.012) (0.040) (0.043) (0.063) (0.080) (0.079) (0.009) 2017 0.217*** 0.444*** 1.443*** 1.279*** -0.801*** -1.077*** 0.090*** (0.022) (0.038) (0.046) (0.061) (0.078) (0.081) (0.008) Constante 0.030 0.786*** 0.311*** 1.361*** 1.212*** 1.099*** 8.639*** (0.030) (0.079) (0.091) (0.085) (0.104) (0.105) (0.020) Observaciones 8,988 8,988 8,988 8,988 8,988 8,988 8,656 Panel C: ANCOVA Tratamiento -0.020 0.028 -0.029 -0.002 -0.011 0.026 -0.002 (0.022) (0.042) (0.047) (0.046) (0.027) (0.036) (0.010) Y (97) 0.522*** 0.146*** 0.279*** 0.158*** 0.038*** 0.029** 0.383*** (0.077) (0.017) (0.019) (0.018) (0.008) (0.011) (0.032) Constante 0.295*** 1.287*** 1.731*** 2.504*** 0.704*** 0.210*** 5.401*** (0.057) (0.098) (0.116) (0.088) (0.071) (0.075) (0.279) Observaciones 4,494 4,494 4,494 4,494 4,494 4,494 4,169 Media T 2017 0.247 1.473 1.928 2.532 0.656 0.426 9.052 Media C 2017 0.241 1.435 1.891 2.497 0.662 0.386 9.041 Esta tabla muestra los efectos a largo plazo del programa en un conjunto de variables que resultan de la agregación de grupos de bienes duraderos y características de los hogares. Las observaciones se limitan a los hogares a partir de 1997 que se encontraron con éxito en 2017 (hogares originales). Los resultados considerados son: (1) Transporte, que suma el número de automóviles y camionetas; (2) Equipo de entretenimiento, que agrega el número de equipos de televisión, radio y sonido; (3) Utensilios de cocina, que suma los siguientes aparatos: licuadora, refrigerador, parrilla eléctrica, estufa de gas o microondas; (4) Servicios básicos, que consiste en la disponibilidad de los siguientes servicios: piso firme, electricidad, drenaje y acceso al agua en la propiedad; (5) Artículos de TI, que se refiere al número de computadoras y teléfonos celulares; y (6) Servicios de TI, que suma teléfono fijo, internet y televisión de paga (7) ln(cons imp), es la medida imputada de los gastos no duraderos en alimentos, productos personales y prendas de vestir. La información empleada proviene de la ENCASEH 1997 y la ENCEL 2017-2018. El Panel A muestra el resultado de una estimación transversal que sólo utiliza datos de 2017. La variable de Tratamiento es una variable dummy que identifica si la observación pertenece a una de las 320 localidades de tratamiento iniciales del RCT de Progresa. El Panel B realiza una estimación DID con 1997 y 2017 como los dos períodos considerados. El Panel C estima un ANCOVA, que controla por el nivel preexistente de la variable dependiente (denotada como Y (97)). Los controles incluyen (de la ENCASEH 1997): Edad, educación y uso de un dialecto del jefe de familia, tamaño del hogar, % de miembros menores de 15 años, dummies para la propiedad de casa, tierras productivas y animales de tiro, e índice de marginación de la localidad. Errores estándar agrupados a nivel de localidad. Los asteriscos indican nivel de significancia del ***1 %, **5 % y *10 %. 23 VI.A.2 Hogares Nuevos En esta sección se analizan los efectos en la compra de bienes durables y de los gastos de consumo imputados para los hogares nuevos, tal como se definieron anteriormente: se trata en su mayoría de la descendencia de los hogares originales, potencialmente aquellos niños en 1997 que fueron el objetivo de la política. Como estos nuevos hogares están compuestos por los beneficiarios directos de las transferencias del programa, son quizás el grupo más interesante para analizar. Cabe destacar, como se describe en la Tabla 4, que los hogares nuevos son más jóvenes (como era esperado), los jefes del hogar tienen una media de 31 años y, en promedio, tienen alrededor de 5 años más de educación que los hogares de sus padres. Además, el tamaño del hogar es menor que el de los hogares originales en 1997, con un tamaño de alrededor de 4 miembros, frente a los 7 miembros de su hogar parental. En la práctica, se trata de hogares jóvenes con menos miembros y con más educación. También se observa que el hecho de que ser un participante temprano en PROSPERA no predice la recepción de transferencias de PROSPERA en 2017, es decir, es igualmente probable que tanto la descendencia de los hogares que han recibido tratamiento temprano como la descendencia de los que lo han recibido de manera tardía reciban PROSPERA en 2017. En la Tabla 7 se presentan los resultados para estos hogares nuevos. Una motivación importante para realizar un análisis separado para estos hogares proviene del hecho de que el programa tiene como uno de sus principales propósitos romper el ciclo de pobreza transmitido de padres a hijos e hijas. Los nuevos hogares estarán compuestos en su mayoría por miembros que eran niños en 1997. Para estos hogares, los resultados son más alentadores: en el caso de los equipos de entretenimiento, los utensilios de cocina y los servicios de TI y entretenimiento, los efectos son positivos y significativos. Además, la magnitud del efecto no es insignificante, representa un aumento de los bienes duraderos de entre el 7 % y 16 % respecto a los hogares de control. Además, para el consumo imputado los efectos son positivos y significativos, con un aumento de alrededor del 5 % en el gasto no duradero, un efecto no trivial si se tiene en cuenta el margen de tratamiento utilizado. Dado que se están buscando hogares nuevos, es decir, hogares compuestos por personas que se han mudado de sus hogares de origen, debemos tener en cuenta que el proceso de formación de los hogares puede no ser puramente aleatorio. Por esta razón, en la Tabla 8 se proporciona evidencia sobre la fuerza de dicho mecanismo de selección, y se demuestra que en promedio no hay evidencia sólida de que el programa motive a los individuos jóvenes a que se muden fuera del hogar paterno (columna 1 Tabla 8). Tanto en el grupo de tratamiento como en el de control, la proporción de personas que se muda de un hogar a otro y crea su propio hogar es del 60 %. Sin embargo, este efecto promedio se matiza al observar los diferentes grupos de edad como se hace en la columna 2. Los niños muy pequeños (0-5 años en 1997) tienden a permanecer más tiempo en el hogar original, mientras que los niños mayores (11-16 años en 1997) se mudan antes para formar su propio hogar. De manera similar, y muy importante para el programa, estos mismos niños mayores tienen mayor probabilidad de emigrar fuera de su 24 localidad de nacimiento, de hecho, dada la magnitud de los coeficientes de formación y migración de hogares nuevos, parece que una gran proporción de los hogares nuevos se forman en lugares diferentes a aquellos donde residen sus padres. El comportamiento migratorio es consistente con el canal de acumulación de capital humano, lo que hace que la migración sea parte de este, o que sea simplemente una forma de extraer los beneficios de un mayor capital humano. Por estas razones, se analiza si quienes emigraron eligieron mudarse a una ciudad grande (Ciudad de México, Guadalajara o Monterrey), ya que generalmente las ciudades más grandes proveen más oportunidades para el crecimiento (Moretti 2012; De La Roca y Puga 2017). Si bien este último análisis es tentativo, ya que se basa en una muestra seleccionada de migrantes, podría aportar algunas ideas interesantes. sin embargo, parece que no existe ningún tipo de correlación entre recibir el tratamiento y mudarse a una gran ciudad para ninguno de los grupos. Se observa que los resultados para los hogares nuevos son robustos al controlar por el hecho de que el nuevo hogar sea en sí mismo beneficiario de PROSPERA. 25 Tabla 7: Efectos en la acumulación de bienes duraderos. Hogares nuevos. (1) (2) (3) (4) (5) (6) (7) Transporte Eq. de Artículos de Servicios Artículos TI Servicios ln(cons imp) entr. cocina básicos TI Panel A: Transversal Tratamiento -0.001 0.092** 0.158** 0.067 0.035 0.059* 0.036** (0.024) (0.045) (0.062) (0.042) (0.034) (0.035) (0.014) Constante 0.223*** 1.529*** 1.847*** 2.456*** 0.779*** 0.337*** 8.826*** (0.080) (0.153) (0.170) (0.109) (0.093) (0.114) (0.037) Observaciones 2,265 2,265 2,265 2,265 2,265 2,265 2,152 Panel B: DID 1997-2017 Tratamiento X 2017 0.014 0.194*** 0.244*** 0.025 0.197* 0.217* 0.054*** (0.028) (0.067) (0.070) (0.087) (0.118) (0.125) (0.014) Tratamiento -0.011 -0.115** -0.080 0.032 -0.186* -0.184* -0.017 (0.014) (0.052) (0.052) (0.069) (0.102) (0.102) (0.011) 2017 0.170*** 0.312*** 1.338*** 1.232*** -0.735*** -1.166*** 0.208*** (0.023) (0.051) (0.052) (0.063) (0.090) (0.099) (0.009) Constante 0.016 1.013*** 0.422*** 1.345*** 1.318*** 1.313*** 8.644*** (0.043) (0.125) (0.123) (0.104) (0.143) (0.146) (0.027) Observaciones 4,530 4,530 4,530 4,530 4,530 4,530 4,407 Panel C: ANCOVA Tratamiento 0.001 0.096** 0.173*** 0.066 0.045 0.060* 0.042*** (0.024) (0.045) (0.060) (0.041) (0.034) (0.035) (0.013) Y (97) 0.195** 0.035 0.209*** 0.039** 0.047*** 0.006 0.310*** (0.081) (0.027) (0.034) (0.018) (0.010) (0.014) (0.045) Constante 0.227*** 1.501*** 1.776*** 2.399*** 0.726*** 0.330*** 6.139*** (0.080) (0.155) (0.168) (0.111) (0.095) (0.117) (0.398) Observaciones 2,265 2,265 2,265 2,265 2,265 2,265 2,149 Media T 2017 0.208 1.450 1.992 2.605 0.840 0.428 9.241 Media C 2017 0.200 1.354 1.793 2.522 0.793 0.361 9.203 Esta tabla muestra los efectos a largo plazo del programa en un conjunto de variables que resultan de la agregación de grupos de bienes duraderos y características de los hogares. Las observaciones se limitan a los hogares recién formados en 2017 (hogares nuevos) que se identificaron mediante la búsqueda de miembros que ya no estaban presentes en sus hogares originales de 1997. Los resultados considerados son: (1) Transporte, que suma el número de automóviles y camionetas; (2) Equipo de entretenimiento, que agrega el número de equipos de televisión, radio y sonido; (3) Utensilios de cocina, que suma los siguientes aparatos: licuadora, refrigerador, parrilla eléctrica, estufa de gas o microondas; (4) Servicios básicos, que consiste en la disponibilidad de los siguientes servicios: piso firme, electricidad, drenaje y acceso al agua en la propiedad; (5) Artículos de TI, que se refiere al número de computadoras y teléfonos celulares; y (6) Servicios de TI, que suma teléfono fijo, internet y televisión de paga (7) ln(cons imp), es la medida imputada de los gastos no duraderos en alimentos, productos personales y prendas de vestir. La información empleada proviene de la ENCASEH 1997 y la ENCEL 2017-2018. El Panel A muestra el resultado de una estimación transversal que sólo utiliza datos de 2017. La variable de Tratamiento es una variable dummy que identifica si la observación pertenece a una de las 320 localidades de tratamiento iniciales del RCT de Progresa. El Panel B realiza una estimación DID con 1997 y 2017 como los dos períodos considerados. El Panel C estima un ANCOVA, que controla por el nivel preexistente de la variable dependiente (denotada como Y (97)). Los controles incluyen (de la ENCASEH 1997): Edad, educación y uso de un dialecto del jefe de familia, tamaño del hogar, % de miembros menores de 15 años, dummies para la propiedad de casa, tierras productivas y animales de tiro, e índice de marginación de la localidad. Errores estándar agrupados a nivel de localidad. Los asteriscos indican nivel de significancia del ***1 %, **5 % y *10 %. 26 Tabla 8: Migración y formación de hogares nuevos. (1) (2) (3) (4) (5) (6) Hogar Hogar Migró Migró Metrópolis Metrópolis nuevo nuevo Tratamiento -0.009 0.015 0.022 -0.033 0.005 -0.004 (0.0216) (0.0415) (0.0234) (0.0398) (0.0308) (0.0577) T x (0-5) -0.122*** 0.026 0.030 (0.0403) (0.0358) (0.0543) T x (6-10) 0.062 0.095** (0.004) (0.0443) (0.0402) (0.0572) T x (11-16) 0.117** 0.114*** -0.031 (0.0454) (0.0418) (0.0600) Constante 0.351*** 0.379*** -0.001 0.019 -0.061 -0.060 (0.0642) (0.0657) (0.0608) (0.0619) (0.105) (0.106) Observaciones 3,351 3,351 3,351 3,351 969 969 R cuadrado 0.017 0.041 0.011 0.016 0.044 0.046 Media C 0.573 0.273 0.127 Media C (0-5) 0.261 0.261 0.133 Media C (6-10) 0.603 0.272 0.104 Media C (11-16) 0.788 0.370 0.176 Media C 16+ 0.731 0.172 0.000 Esta tabla está compuesta por modelos de probabilidad lineal, cuyo propósito es identificar si el tratamiento podría haber inducido la formación de un nuevo hogar o la migración fuera del hogar original. La unidad de observación son los individuos en los grupos de edad relevantes, como se describe en la sección IV. Los resultados son dummies que corresponden a: (i) Hogar nuevo, que identifica si el individuo habita en un hogar nuevo (a diferencia de un hogar original) (ii) Migró que identifica si el individuo emigró a una localidad diferente de la que estaba ubicado el hogar original; y (iii) Metrópolis indica si dicha migración tuvo como destino la Ciudad de México, Guadalajara o Monterrey, que son las principales ciudades urbanas mexicanas. Los controles incluyen (de la ENCASEH 1997): Edad, educación y uso de un dialecto del jefe de familia, tamaño del hogar, % de miembros menores de 15 años, dummies para la propiedad de casa, tierras productivas y animales de tiro, e índice de marginación de la localidad. Errores estándar agrupados a nivel de localidad. Los asteriscos indican nivel de significancia del ***1 %, **5 % y *10 %. 27 VI.A.3 Estimaciones Ponderadas La Tabla 9 muestra los resultados de la ponderación de las observaciones en la muestra para replicar los resultados que se habrían obtenido sin atrición. Dado que la atrición se produjo de diferentes formas, se realizaron tres diferentes comparaciones. El método empleado consiste en ponderación de probabilidad inversa (DiNardo et al., 1996). Como primer paso, se estima un modelo logit de atrición con respecto a un grupo de variables. Todas las observaciones se emplean en esta etapa, ya que las variables explicativas de la base de referencia de la ENCASEH de 1997 se utilizan para predecir la atrición. Basado en los resultados de este logit, se calcula un factor de ponderación que se utilizará con la muestra de análisis de las estimaciones anteriores. El Panel A se refiere a los hogares originales. Se consideran dos fuentes de atrición, como se describió en la sección IV.A: (i) composición de las localidades, ya que sólo se encuestó una submuestra de las 506 localidades originales; y (ii) atrición por falta de respuesta, lo que significa que no se encontraron algunos hogares en las localidades seleccionadas. En la primera parte del Panel A (muestra de análisis) se muestran los principales resultados estimados con el ANCOVA para los hogares originales, por razones comparativas. A continuación, se muestran los resultados si no hubiera habido atrición (distribución original). Esto corresponde a la distribución de los hogares en las 506 localidades y se añade por razones comparativas con respecto a la literatura original sobre el programa. El factor de ponderación utilizado para este resultado es el que se incluye en la columna (1) de la Tabla 3. Como puede observarse, no se obtienen efectos significativos en la acumulación de activos para esta muestra ponderada. Posteriormente, en la tercera parte del Panel A, se muestran los resultados que se obtendrían si sólo se controlara por la atrición por falta de respuesta. Es decir, el propósito es replicar la distribución de todos los hogares en las 334 localidades seleccionadas. El factor de ponderación en este caso corresponde a la columna (3) de la Tabla 3. Nuevamente, no se observan efectos significativos en la acumulación de activos. Estos resultados eran esperados, ya que en el análisis previo no se encontró evidencia de atrición diferencial entre los grupos de tratamiento. El Panel B se refiere a los hogares nuevos. Para este grupo la atrición parece ser más relevante. En este caso, la atrición se refiere a la imposibilidad de encontrar a todos los individuos de los grupos de edad relevantes que salieron de sus hogares para formar un hogar nuevo (o se unieron a otro hogar). Las columnas (5) y (6) en la Tabla 3 muestran el análisis de atrición para este grupo. Para empezar, se encontró una pequeña proporción de individuos (40 %). Segundo, el análisis de atrición muestra algunas diferencias pequeñas y significativas entre el tratamiento y el control (la prueba conjunta con los términos de interacción tiene un valor p de 0.075). Por esta razón, se realiza una estrategia de ponderación mediante el uso de los resultados de la columna (6), en la que se incluyeron los términos de interacción. Este factor de ponderación reproduciría la distribución de los hogares que se produciría si todos los individuos de los grupos de edad relevantes que se mudaron de su hogar original hubieran sido encontrados en su nuevo hogar. Los resultados se muestran en comparación con los resultados principales del 28 ANCOVA (muestra de análisis). Como puede verse en la tabla, los resultados en acumulación de activos son muy similares a los que resultan del análisis con la muestra encontrada. Tabla 9: Estimaciones reevaluadas de los efectos a largo plazo sobre la acumulación de bienes duraderos. (1) (2) (3) (4) (5) (6) (7) Transporte Eq. de Sum. de Serv. Artículos TI Serv. ln(cons imp) entr. cocina básicos TI Panel A: Hogares originales 1. Muestra de análisis Tratamiento -0.020 0.028 -0.029 -0.002 -0.011 0.026 -0.002 (0.022) (0.042) (0.047) (0.046) (0.027) (0.036) (0.010) Observaciones 4,494 4,494 4,494 4,494 4,494 4,494 4,169 2. Distribución original Tratamiento -0.016 -0.002 -0.025 -0.004 -0.011 0.029 -0.005 (0.021) (0.043) (0.047) (0.049) (0.028) (0.033) (0.010) Observaciones 4,471 4,471 4,471 4,471 4,471 4,471 4,150 3. Distribución 2017 de localidades Tratamiento -0.016 -0.001 -0.027 -0.004 -0.014 0.033 -0.005 (0.021) (0.043) (0.047) (0.048) (0.028) (0.033) (0.010) Observaciones 4,471 4,471 4,471 4,471 4,471 4,471 4,150 Media T 2017 0.247 1.473 1.928 2.532 0.656 0.426 9.052 Media C 2017 0.241 1.435 1.891 2.497 0.662 0.386 9.041 Panel B: Hogares nuevos 1. Muestra de análisis Tratamiento 0.001 0.096** 0.173*** 0.066 0.045 0.060* 0.042*** (0.024) (0.045) (0.060) (0.041) (0.034) (0.035) (0.013) Observaciones 2,265 2,265 2,265 2,265 2,265 2,265 2,149 2. Distribución localidades 2017 de -0.005 0.076 0.144** 0.052 0.041 0.054 0.040*** Tratamiento (0.026) (0.049) (0.065) (0.043) (0.036) (0.037) (0.013) Observaciones 1,912 1,912 1,912 1,912 1,912 1,912 1,822 Media T 2017 0.208 1.450 1.992 2.605 0.840 0.428 9.241 Media C 2017 0.200 1.354 1.793 2.522 0.793 0.361 9.203 Esta tabla muestra los efectos a largo plazo del programa sobre un conjunto de variables que resultan de la agregación de grupos de bienes duraderos y características de los hogares. La estrategia empleada consiste en ponderación de probabilidad inversa (DiNardo et al., 1996). En el Panel A, las observaciones se restringen a los hogares incluidos en la ENCASEH 1997 (hogares originales), mientras que, en el Panel B, las observaciones se restringen a los hogares recién formados en 2017 (hogares nuevos) que se identificaron mediante la búsqueda de miembros que ya no estaban presentes en sus hogares originales de 1997. La estrategia de ponderación busca reproducir la distribución original de la muestra. Se establecen como objetivo dos distribuciones diferentes, siguiendo el análisis de atrición realizado en la Tabla 3.La Distribución original se refiere a la muestra de 1997, que corresponde a los hogares originales en las 506 localidades. El propósito es hacer que los resultados sean comparables a la vasta literatura que se enfoca en este grupo. La distribución de las localidades de 2017 se basa en las 334 localidades elegidas para la muestra y supone que se hubieran encontrado todos los hogares originales de 1997 en esas localidades. Los resultados considerados son: (1) Transporte, que suma el número de automóviles y camionetas; (2) Equipo de entretenimiento, que agrega el número de equipos de televisión, radio y sonido; (3) Utensilios de cocina, que suma los siguientes aparatos: licuadora, refrigerador, parrilla eléctrica, estufa de gas o microondas; (4) Servicios básicos, que consiste en la disponibilidad de los siguientes servicios: piso firme, electricidad, drenaje y acceso al agua en la propiedad; (5) Artículos de TI, que se refiere al número de computadoras y teléfonos celulares; y (6) Servicios de TI, que suma teléfono fijo, internet y televisión de paga (7) ln(cons imp), es la medida imputada de los gastos no duraderos en alimentos, productos personales y prendas de vestir. La información empleada proviene de la ENCASEH 1997 y la ENCEL 2017-2018. La Tabla muestra los resultados de una estimación ANCOVA, que controla por el nivel preexistente de la variable dependiente (denotada como Y (97)). Los controles incluyen (de la ENCASEH 1997): Edad, educación y uso de un dialecto del jefe de familia, tamaño del hogar, % de miembros menores de 15 años, dummies para la propiedad de casa, tierras productivas y animales de tiro, e índice de marginación de la localidad. Errores estándar agrupados a nivel de localidad. Los asteriscos indican nivel de significancia del ***1 %, **5 % y *10 %. 29 VI.B Los Jóvenes y la Transmisión Intergeneracional Es de suma importancia al estudiar los efectos a largo plazo de un programa tan importante, analizar tanto el ciclo de vida como los efectos intergeneracionales; en última instancia, el éxito a largo plazo de la política se basará en el éxito de la descendencia de los hogares tratados inicialmente o de los niños que se beneficiaron directamente de las transferencias del gobierno, así como de los demás componentes del programa. VI.B.1 Efectos en el Grupo de Edad Relevante Para explorar mejor los efectos para la muestra de individuos que forman la "siguiente generación", se considera a los individuos clasificados en el grupo de interés, según su edad. Recordemos que esto incluye a personas que en 1997 eran recién nacidas, que recién comenzaban la escuela o que estaban en sexto grado de primaria. Por ejemplo, si se observan los efectos de PROSPERA para aquellos que se benefician de la política a lo largo de su vida, se está observando el efecto de la exposición a la política sobre los resultados de su ciclo de vida. De igual manera, resulta interesante saber si a los hijos de los hogares originales, que son beneficiarios de las transferencias, les está yendo mejor que a sus padres. Así, se analizaría la movilidad intergeneracional y la transmisión de los ingreso, capital humano y consumo. Ambas dimensiones son bastante importantes: la visión del ciclo de vida investigará si el ser tratado en una etapa temprana de la vida podría tener consecuencias a largo plazo (como en Hoddinott et al. 2008 y Martorell 2017); por otro lado, la visión intergeneracional aborda el vínculo entre padres e hijos y analiza cómo PROSPERA puede fomentar la movilidad ascendente en la sociedad al mejorar las vidas de la próxima generación con respecto a las de sus padres. La Tabla 10 sugiere que la siguiente generación es el grupo de individuos el que está conduciendo los resultados positivos para los hogares nuevos, ya que las variables de equipos de entretenimiento, utensilios de cocina y gasto en consumo no duradero tienen efectos significativos en este análisis, con magnitudes similares a las encontradas anteriormente. El Panel B explora la heterogeneidad de los efectos, distinguiendo entre los miembros jóvenes que aún viven en el hogar original y los que formaron su propio hogar. Este análisis confirma la hipótesis anterior: los miembros jóvenes que formaron sus propios hogares se benefician significativamente del programa. El Panel C también indica que, en cuanto a la edad, los individuos que impulsan los resultados positivos corresponden a los que tenían entre 11 y 16 años en 1997 (es decir, los que se encontraban en sus etapas críticas de escolaridad, en las que las tasas de deserción escolar son más comunes). Es importante destacar que este último análisis confirma que los niños en riesgo de abandonar la escuela secundaria continuaron estudiando gracias al programa, es decir, las personas de entre 11 y 16 años en 1997; además, para este grupo se observan efectos positivos sostenidos en las compras duraderas, así como para todos los demás resultados. Sin embargo, se debe subrayar que también existe una redistribución de recursos dentro del hogar, ya que los niños mayores de 16 años en 1997, que en su mayor parte no recibieron transferencias directas 30 escolares por tener más edad, parecen haberse beneficiado con respecto a su contraparte de control, sobre todo en lo que se refiere a los bienes duraderos de cocina, pero también (aunque no de forma significativa) en las otras categorías de bienes duraderos. Aquí se observa que, como evidencia del canal directo a través del mejoramiento del capital humano, los resultados en la escolaridad y, en parte, el efecto sobre los ingresos (que no difiere significativamente de cero) construyen una conexión directa entre la política y sus efectos a largo plazo. En el Panel D, se investiga si PROSPERA otorgó algún tipo de seguro contra las crisis de salud del jefe del hogar, se observa que los efectos positivos de PROSPERA sobre los bienes duraderos y no duraderos también están presentes para aquellos hogares que sufrieron una crisis de salud (aunque son menos robustos y no son significativos). Cabe señalar que las crisis de salud rara vez son totalmente exógenas, por lo que este es sólo un análisis de correlación tentativo. Por último, como se muestra en el Panel E, los efectos positivos son impulsados principalmente por los migrantes (pero no por los migrantes a las grandes ciudades). Curiosamente, parece ser que estos individuos mejoraron sus condiciones en términos de bienes duraderos, pero no en términos de ingresos. VI.B.2 Transmisión intergeneracional En la Tabla 11 se muestran los efectos de PROSPERA en la movilidad intergeneracional en términos de la divergencia de los resultados de los hijos respecto a los de sus padres, siendo este uno de los aspectos más relevantes de una evaluación a largo plazo. Para la nueva generación, la descendencia, que aún vive en casa, se encuentra relativamente poco más allá de un cierre de la brecha más pronunciado para los hogares tratados en términos de percentil de ingreso. Resulta más interesante que para los hogares recién formados en el Panel B, se observa importante evidencia de mejora en las clasificaciones de educación, tenencia de activos y distribución de ingresos. de hecho, los resultados sugieren que PROSPERA también mejoró la movilidad general, de modo que no sólo los niños de los hogares originales con mejores condiciones iniciales parecen tener mejorías, sino, particularmente, los que comenzaron en un segmento más bajo de la distribución parecen mejorar sus condiciones (véase el signo de menos en el coeficiente de Trat *Y (G1)). Estos efectos son relevantes desde el punto de vista económico, y son bastante alentadores, ya que muestran movilidad ascendente para los beneficiarios, exactamente lo que el programa pretendía lograr. 31 Tabla 10: Efectos heterogéneos de PROSPERA en los miembros jóvenes. (1) (2) (3) (4) (5) (6) (7) (8) Transporte Eq. de Utens. de Servicios Años de Ing > 0 log(ingreso) ln(cons entret. cocina básicos escolaridad imp) Panel A: General Tratamiento X 2017 0.0275 0.119* 0.142** -0.0119 0.0269 -0.0194 -0.0736 0.0311*** (0.0272) (0.0609) (0.0593) (0.0820) (0.209) (0.0273) (0.0848) (0.0119) Panel B: Estado del hogar Hogar original 0.050 0.043 -0.007 -0.042 0.221 -0.062* -0.113 0.001 (0.039) (0.072) (0.072) (0.090) (0.261) (0.038) (0.094) (0.014) Hogar nuevo 0.009 0.174** 0.253*** 0.011 -0.130 0.028 -0.046 0.054*** (0.029) (0.069) (0.072) (0.088) (0.237) (0.027) (0.100) (0.014) Panel C: Grupos de edad (en 1997) 0-5 0.025 0.072 0.148** -0.035 0.200 -0.009 -0.043 0.022 (0.032) (0.075) (0.072) (0.089) (0.220) (0.035) (0.065) (0.015) 6-10 -0.001 0.108 0.019 -0.001 0.167 -0.013 -0.070 0.031* (0.036) (0.091) (0.085) (0.100) (0.258) (0.036) (0.058) (0.018) 11-16 0.057 0.329*** 0.262** -0.017 0.711*** -0.016 0.097 0.050** (0.048) (0.101) (0.112) (0.131) (0.252) (0.052) (0.166) (0.021) Más de 16 0.097 0.051 0.307** 0.130 -0.043 -0.023 0.187 0.045 (0.060) (0.147) (0.154) (0.137) (0.293) (0.087) (0.171) (0.034) Panel D: Crisis de salud Sin crisis de salud 0.026 0.178*** 0.148** 0.002 0.041 -0.047 -0.122 0.033*** (0.030) (0.068) (0.066) (0.086) (0.228) (0.031) (0.092) (0.013) Con crisis de salud 0.031 -0.038 0.127 -0.103 -0.010 0.047 0.052 0.027 (0.038) (0.078) (0.081) (0.100) (0.293) (0.039) (0.110) (0.018) Panel E: Migración Misma localidad 0.043 0.061 0.074 -0.056 -0.086 -0.035 -0.057 0.013 (0.031) (0.068) (0.068) (0.087) (0.232) (0.032) (0.102) (0.012) Mig: Metrópolis 0.047 0.477** -0.043 0.225 0.603 0.031 -0.176 0.047 (0.063) (0.225) (0.2142) (0.239) (0.986) (0.045) (0.224) (0.043) Mig: otros -0.017 0.227** 0.314*** 0.055 0.226 0.007 -0.184 0.061 (0.042) (0.092) (0.098) (0.112) (0.311) (0.032) (0.110) (0.020) Observaciones 6,702 6,702 6,702 6,702 6,702 5,484 4,794 6,527 Media C 1997 0.020 0.985 0.412 1.218 1.392 0.036 0.237 8.971 Media C 2017 0.220 1.420 1.814 2.483 8.009 0.799 8.118 9.139 Esta tabla muestra la posible heterogeneidad del efecto a largo plazo correspondiente a diferentes por grupos específicos de interés. La unidad de observación es el individuo, que podría estar en un hogar original o nuevo. Los resultados considerados son: (1) Transporte, que suma el número de automóviles y camionetas; (2) Equipo de entretenimiento, que agrega el número de equipos de televisión, radio y sonido; (3) Utensilios de cocina, que suma los siguientes aparatos: licuadora, refrigerador, parrilla eléctrica, estufa de gas o microondas; (4) Servicios básicos, que consiste en la disponibilidad de los siguientes servicios: piso firme, electricidad, drenaje y acceso al agua en la propiedad; (5) Años de escolaridad formal completa; (6) Ingreso per cápita del hogar superior a cero; (7) log(ingreso), es el ingreso total del individuo; and (8) log(cons imp), es la medida imputada de los gastos no duraderos en alimentos, productos personales y ropa. Los datos empleados provienen de la ENCASEH 1997 y la ENCEL 2017-2018. El panel A muestra una estimación DID. El panel B estima el efecto del tratamiento para los diferentes tipos de hogares: originales y nuevos. El Panel C explora las diferencias en el efecto del tratamiento por grupos de edad formados con base en las edades asociadas a las etapas de escolaridad críticas. El panel D muestra diferencias según el estado de las crisis de salud (definidas como la presencia de al menos un miembro del hogar enfermo o lesionado durante las dos semanas anteriores a la encuesta). El Panel E analiza el efecto del tratamiento por estatus migratorio (Metrópolis incluye la Ciudad de México, Guadalajara y Monterrey). Los controles incluyen (de la ENCASEH 1997): Edad, educación y uso de un dialecto del jefe de familia, tamaño del hogar, % de miembros menores de 15 años, dummies para la propiedad de casa, tierras productivas y animales de tiro, e índice de marginación de la localidad. Errores estándar agrupados a nivel de localidad. Los asteriscos indican nivel de significancia del ***1 %, **5 % y *10 %. 32 Tabla 11: Transmisión intergeneracional. Convergencia / Divergencia Años de escolaridad Percentil de índice de activos Percentil de ingreso (1) (2) (3) (4) (5) (6) ∆Y ∆Y ∆Y ∆Y ∆Y ∆Y Panel A: Hogares originales Trat -0.282 -0.0788 1.892 -3.000 0.889 -7.220* (0.219) (0.337) (1.858) (2.521) (2.965) (3.830) Y (G1)1997 -0.657*** -0.681*** -0.997*** (0.0636) (0.0457) (0.0564) Trat ∗ Y (G1)1997 -0.031 0.092* 0.113 (0.0723) (0.0520) (0.0746) Constante 1.270* 6.942*** 2.515 38.73*** 59.71*** 93.42*** (0.679) (0.717) (6.794) (5.755) (8.744) (7.655) Observaciones 1,442 1,442 1,432 1,432 939 939 R cuadrado 0.056 0.266 0.027 0.275 0.081 0.486 Media C Y (G1)1997 2.86 2.86 37.00 37.00 44.24 44.24 Media C Y (G2)2017 8.32 8.32 45.04 45.04 56.08 56.08 Panel B: Hogares nuevos Trat 0.298 0.833*** 6.918*** 4.035 5.950** 6.579* (0.192) (0.270) (2.269) (2.860) (2.549) (3.629) Y (G1)1997 -0.657*** -0.862*** -0.833*** (0.0469) (0.0436) (0.0524) Trat ∗ Y (G1)1997 -0.139** 0.014 -0.078 (0.0555) (0.0572) (0.0644) Constante 4.061*** 8.173*** -16.51** 30.07*** 11.61 55.85*** (0.705) (0.625) (6.932) (5.891) (9.296) (7.894) Observaciones 1,891 1,891 1,880 1,880 1,354 1,354 R cuadrado 0.089 0.391 0.054 0.357 0.069 0.423 Media C Y (G1)1997 2.71 2.71 38.89 38.89 42.46 42.46 Media C Y (G2)2017 7.76 7.76 40.51 40.51 42.36 42.36 Esta tabla analiza la movilidad intergeneracional en relación a la posición de los padres (Generación 1, G1) para comprender cómo los hogares más pobres o más ricos logran cambiar su posición distributiva para resultados específicos, y cómo el Tratamiento afecta esta relación. La movilidad intergeneracional se define como ∆ Y = Y (G2)2017 - Y (G1)1997, donde Y(G2)2017 y Y(G1)1997 se definen como el resultado de la descendencia (G2) o de los padres (G1) observados en 2017 o − 1997, respectivamente. Los resultados de interés que se consideran son: (1) años de escolaridad; (2) un índice de activos duraderos formado por un componente principal que considera la propiedad de automóviles, camionetas, televisión, radio, equipo de sonido, licuadora, refrigerador, parrilla eléctrica, estufa de gas, horno de microondas, piso firme, electricidad, drenaje y acceso al agua en la propiedad; y (3) ingresos mensuales. Para la columna (1) se utiliza directamente el nivel de años de escolaridad. Para las columnas (2) y (3), el percentil de cada resultado se calcula en relación con todos los individuos dentro del mismo rango de edad de 10 años. La unidad de observación son las personas en los grupos de edad relevantes, y sus padres, como se describe en la sección IV. Los controles incluyen (de la ENCASEH 1997): Edad, educación y uso de un dialecto del jefe de familia, tamaño del hogar, % de miembros menores de 15 años, dummies para la propiedad de casa, tierras productivas y animales de tiro, e índice de marginación de la localidad. Errores estándar agrupados a nivel de localidad. Los asteriscos indican nivel de significancia del ***1 %, **5 % y *10 %. 33 VI.C Estimaciones DID sobre la Implementación del Programa La segunda estrategia de identificación, basada en la expansión secuencial de la política, proporciona evidencia adicional, y comprende mayores diferencias en cuanto a la exposición al programa que la variación experimental discutida hasta ahora. Al mismo tiempo, los datos empleados en esta parte contienen medidas directas de seguridad alimentaria y vulnerabilidad añadiendo otra dimensión al análisis del bienestar. Además de eso, también se puede probar el efecto de PROSPERA en la dependencia posterior de los programas gubernamentales, siendo una política exitosa aquella capaz de graduar a sus beneficiarios fuera de los programas sociales. El enfoque de este análisis consiste en producir estimaciones de DID de manera similar a Parker y Vogl (2018), pero con los datos intercensales del INEGI de 201519 . La Figura 2 contiene las principales estimaciones de esta estrategia. Cada sub gráfica muestra las estimaciones de τ de la ecuación (5), que corresponde a los estimadores de diferencias en diferencias. A medida que uno se mueve hacia la derecha a través del eje X, se incrementa la exposición a PROSPERA (calculada comparando el año 1998 con diferentes periodos tardíos de adscripción) para una cohorte dada con respecto a la cohorte que no debería ser beneficiada por el programa (individuos de 17 a 22 años en 2001). Los resultados muestran efectos positivos en educación, especialmente para la cohorte con los miembros más jóvenes, lo que aumenta su nivel de escolaridad entre 0.5 y 1.5 años adicionales. Para las otras cohortes, el programa implica un aumento de alrededor de 0.5 años de escolaridad. En cuanto a los ingresos, se observan efectos positivos y significativos: los ingresos per cápita de los hogares aumenta entre el 2 % y 8 %, con los mayores efectos para la cohorte de personas de entre 6 y 10 años en 2001. También se observan efectos positivos para un índice compuesto de características de la vivienda y bienes duraderos. Al analizar los activos por separado, los mayores efectos se encuentran para el tipo de piso, lavadora y teléfono celular. Los mayores efectos se encuentran de nuevo en la cohorte más joven. Para analizar la dependencia de la ayuda del gobierno, o la graduación de los programas sociales se utiliza, como variable dependiente, una dummy igual a 1 si el hogar recibe transferencias del gobierno. En este caso, la evidencia general sugiere que una exposición más prolongada a PROSPERA disminuye la dependencia a la ayuda gubernamental. Desafortunadamente, esta medida no distingue a PROSPERA de otro tipo de ayuda gubernamental. Por último, se examinan las variables tipo proxy para vulnerabilidad y la seguridad alimentaria: dos medidas diferentes que abordan directamente el consumo de alimentos. En primer lugar, se pregunta si algún adulto en el hogar pasó hambre al menos una vez el último mes. En segundo lugar, se pregunta si por falta de dinero se consumió una dieta poco variada. Se consideran estas dos preguntas como 19Como se explicó en la sección V.B, estas estimaciones son parte de la investigación actual en la que se busca usar un diseño de RDD con la regla original que establecía que las localidades participantes serían inscritas en el programa con base en un índice de marginalidad. 34 variables tipo proxy para seguridad alimentaria, vulnerabilidad y calidad de la dieta. Se obtuvieron resultados positivos en esta medida de seguridad alimentaria para las cohortes más jóvenes, ya que aquellas con mayor tiempo de exposición al programa tenían menor probabilidad de pasar hambre (sin embargo, estos estimadores no son precisos). Respecto a la variedad de la alimentación, se observan mayores efectos para las cohortes más jóvenes. Para ellos, la probabilidad de no haber podido adquirir alimentos suficientemente variados disminuye entre 1 y 2 puntos porcentuales para aquellos con una exposición más prolongada.20 Figura 2: Estimaciones de DID mediante el uso de la expansión del programa por cohortes de edad. • ◦ O Estas gráficas muestran los estimadores de DID considerando la expansión del programa para las diferentes cohortes. Los coeficientes graficados corresponden a las τ en la ecuación (5). Cada punto de la gráfica debe interpretarse como el efecto de años adicionales de exposición al programa para una cohorte específica. Para formar el eje X, los años de exposición se calculan al comparar la adscripción en 1998 con el ingreso en años diferentes. Por lo tanto, 1-3 años adicionales implican que las localidades de comparación en esta clasificación ingresaron al programa entre 1999 y 2001; 4-7 años adicionales se comparan con respecto al ingreso al programa entre 2002 y 2005; y finalmente, 8+ años de exposición adicional significa la comparación con las localidades que ingresaron al programa después de 2006. La cohorte C4, que corresponde a individuos de entre 17 y 22 años en 2001, se toma como referencia de control para la selección entre tratamiento temprano y tardío. Los resultados que se usaron son: (1) años de escolaridad, (2) logaritmo del ingreso per cápita del hogar, (3) un índice de bienes duraderos del hogar, (4) una dummy que indica si el hogar recibe transferencias del gobierno, (5) una dummy que indica si algún adulto en el hogar tuvo hambre algún día el mes pasado, y (6) una dummy que indica si los adultos en el hogar no pudieron comer suficiente variedad de alimentos. Las cohortes utilizadas en las gráficas se construyeron considerando la edad del individuo en 2001: (C1) de 0 a 5 años, que corresponde a la línea gris, (C2) de 6 a 10 años, que corresponde a la línea verde, y (C3) de 11 a 16 años, que corresponde a la línea azul. Los puntos sólidos ● son significativos al 5 %, los puntos sin rellenar ○ son significativos al 10 % y los triángulos sin rellenar son estimados no significativos. Los errores estándar se agruparon a nivel de localidad. Los datos utilizados para estas estimaciones provienen de la encuesta intercensal del INEGI 2015. 35 Estos dos últimos efectos sobre seguridad alimentaria, junto con los resultados sobre la dependencia a la ayuda de gobierno, sugieren que una mayor exposición para aquellos quienes más probablemente se beneficiarán de PROSPERA, con respecto a su contraparte de control, ha movido a los beneficiarios a una trayectoria de mayor bienestar. Existen claramente algunas limitaciones a este enfoque, que no difieren de otros estudios que emplean estrategias de DID. Por ejemplo, si principalmente los individuos más capaces de las cohortes más jóvenes emigran de los lugares más pobres, los resultados podrían reflejar un problema de autoselección. Parker y Vogl (2018) proporciona algunos controles de robustez para la migración selectiva al usar la ubicación previa de cada individuo y observar que PROSPERA no parece promover la migración en grandes cantidades.21 VII Conclusiones Se proporciona un análisis de la capacidad de PROSPERA para mejorar la vida social y económica de los hogares originales y sus descendientes. Esto se lleva a cabo con enfoque en los efectos a largo plazo del programa en el bienestar de sus beneficiarios. Aunque el estudio tiene algunas limitaciones debido a los datos disponibles, así como al limitado grado de variación en la intensidad del tratamiento (para la estrategia de identificación más limpia), los efectos a largo plazo de PROSPERA son particularmente alentadores para la descendencia de los hogares tratados inicialmente. Estos hogares nuevos, formados por adultos jóvenes que fueron beneficiarios directos del programa (cuando eran niños), poseen más bienes duraderos e incurren en mayor gasto en consumo no duradero, lo que sugiere un mayor bienestar. Estos resultados son totalmente consistentes con la mejora del capital humano, a través de los efectos sobre la escolaridad y la salud bien documentados por la literatura sobre los efectos de PROSPERA a corto y mediano plazo. Aún más importante, estos hogares nuevos están subiendo la escala económica y social más rápido que su contraparte de control. Su posición, en la distribución correspondiente, es más alta que la de sus padres en términos de posesión de activos e ingresos, y es diferencial para los descendientes de los beneficiarios tempranos de PROSPERA. Se toma este último resultado como evidencia muy alentadora sobre la capacidad de PROSPERA para poner a los beneficiarios en una trayectoria positiva y para sacarlos de la pobreza de manera permanente. Nuestros resultados son totalmente consistentes con la literatura existente, dadas las mejoras en el capital humano (salud y educación), acompañadas de flujos de ingresos más altos y menos volátiles a través del ahorro y la inversión en actividades de mayor rendimiento. A fin de cuentas, el éxito de PROSPERA debe juzgarse por 20Las variables de escasez de alimentos se preguntan por separado para niños y adultos en el hogar. Para los niños se encuentran efectos similares a los presentados en las estimaciones para adultos. 21En el momento de redactar el presente informe, los autores están trabajando más a fondo para abordar estas preocupaciones. 36 sus efectos permanentes y a largo plazo, y por su capacidad para sacar de la pobreza a los beneficiarios y a su descendencia, facilitando su ascenso en la escala social y económica. La dirección futura de estos estudios consiste en adquirir datos más detallados para poder aumentar la evidencia actual con otros indicadores, incluyendo la medición directa del consumo no duradero, y proporcionar una mejor comprensión de los mecanismos exactos detrás de estos hallazgos con la ayuda de un marco teórico formal. 37 Referencias ABEYASEKERA, S. Y P. WARD (2002): "Models for Predicting Expenditure per Adult Equivalent", sin publicar. ADHVARYU, A., A. NYSHADHAM, T. MOLINA, Y J. TAMAYO (2018): "Helping Children Catch Up: Early Life Shocks and the PROGRESA Experiment", Documento de trabajo 24848, National Bureau of Economic Research. AIZER, A., S. ELI, J. FERRIE, Y A. LLERAS-MUNEY (2016): "The Long-Run Impact of Cash Transfers to Poor Families", American Economic Review, 106, 935-71. ANGELUCCI, M. Y G. DE GIORGI (2009): "Indirect Effects of an Aid Program: How Do Cash Transfers Affect Ineligibles’ Consumption?" American Economic Review, 99, 486-508. ANGELUCCI, M., G. DE GIORGI, M. RANGEL, E I. RASUL (2010): "Family networks and school enrolment: Evidence from a randomized social experiment", Journal of Public Economics, 94, 197-221. ANGELUCCI, M., G. DE GIORGI, E I. RASUL (2017): "Consumption and Investment in Resource Pooling Family Networks", The Economic Journal. ATKINSON, A. (2011): "The Restoration of Welfare Economics", American Economic Review, 101, 157-161. ATTANASIO, O., V. DI MARO, V. LECHENE, Y D. PHILLIPS (2013): "Welfare conse- quences of food prices increases: Evidence from rural Mexico", Journal of Development Economics, 104, 136-151. ATTANASIO, O. Y V. LECHENE (2002): "Tests of Income Pooling in Household Decisions", Review of Economic Dynamics, 5, 720-748. ATTANASIO, O., C. MEGHIR, Y A. SANTIAGO (2012): "Education Choices in Mexico: Using a Structural Model and a Randomized Experiment to Evaluate PROGRESA", The Review of Economic Studies, 79, 37-66. ATTANASIO, O. P. Y V. LECHENE (2014): "Efficient Responses to Targeted Cash Trans- fers", Journal of Political Economy, 122, 178-222. ATTANASIO, O. P. Y L. PISTAFERRI (2016): "Consumption Inequality", Journal of Economic Perspectives, 30, 3-28. BAEZ, J. Y A. CAMACHO (2011): Assessing the long-term effects of conditional cash trans- fers on human capital: evidence from Colombia, WPS 5681. 38 BAIRD, S., C. MCINTOSH, Y B. O¨ ZLER (2011): "Cash or Condition? Evidence from a Cash Transfer Experiment *", The Quarterly Journal of Economics, 126, 1709-1753. BANERJEE, A. Y E. DUFLO (2011): Poor economics: a radical rethinking of the way to fight global poverty, Public Affairs. BARHAM, T., K. MACOURS, Y J. MALUCCIO (2017): "Are Conditional Cash Transfers Fulfilling Their Promise? Schooling, Learning, and Earnings After 10 Years". BARRERA-OSORIO, F., L. LINDEN, Y J. SAAVEDRA (2017): "Medium- and Long-Term Educational Consequences of Alternative Conditional Cash Transfer Designs: Experimental Evidence from Colombia". BEHRMAN, J., S. PARKER, Y P. TODD (2011): "Do Conditional Cash Transfers for Schooling Generate Lasting Benefits?: A Five-Year Followup of PROGRESA/Oportunidades" Journal of Human Resources, 46, 93-122. BIANCHI, M. Y M. BOBBA (2010): "Financial Constraints and Occupational Choices: Evidence from Rural Mexico", Sin publicar. BLUNDELL, R., L. PISTAFERRI, Y I. PRESTON (2005): "Imputing consumption in the PSID using food demand estimates from the CEX". ——— (2008): "Consumption Inequality and Partial Insurance", American Economic Review, 98, 1887-1921. BOBONIS, G., R. CASTRO, Y J. MORALES (2015): "Conditional Cash Transfers for Women and Spousal Violence: Evidence of the Long-Term Relationship from the Oportunidades Program in Rural Mexico". BOBONIS, G. J. (2009): "Is the Allocation of Resources within the Household Efficient? New Evidence from a Randomized Experiment" Journal of Political Economy, 117, 453-503. BURSZTYN, L. Y L. C. COFFMAN (2012): "The Schooling Decision: Family Preferences, Intergenerational Conflict, and Moral Hazard in the Brazilian Favelas" Journal of Political Economy, 120, 359-397. CHETTY, R., N. HENDREN, P. KLINE, Y E. SAEZ (2014): "Where is the land of oppor- tunity? The geography of intergenerational mobility in the United States" The Quarterly Journal of Economics, 129, 1553-1623. CUNHA, J., G. DE GIORGI, Y S. JAYACHANDRAN (2018): "The Price Effects of Cash Versus In-Kind Transfers", The Review of Economic Studies. DE LA ROCA, J. Y D. PUGA (2017): "Learning by Working in Big Cities", The Review of Economic Studies, 84, 106-142. 39 DEATON, A. (2018): "What Do Self-reports of Wellbeing Say about Life-Cycle Theory and Policy?" Journal of Public Economics, 162, 18-25. DEATON, A. Y S. ZAIDI (2002): Guidelines for Constructing Consumption Aggregates for Welfare Analysis, El Banco Mundial. DIARIO OFICIAL DE LA FEDERACIO´ N (2017): "Presupuesto de egresos de la federación para el ejercicio fiscal 2018", Rep. tec, Cámara de Diputados del H. Congreso de la Unión, Ciudad de Mexico. ——— (2018): "Reglas de operación de PROSPERA Programa de Inclusión Social", Rep. tec., Secretaría de Desarrollo Social. DINARDO, J., N. FORTIN, Y T. LEMIEUX (1996): "Labor market institutions and the distributions of wages, 1973-1992: A semiparametric approach", Econometrica, 64, 1001-1044. DUFLO, E. (2001): "Schooling and Labor Market Consequences of School Construction in Indonesia: Evidence from an Unusual Policy Experiment", American Economic Review, 91, 795-813. FIZBEIN, A. Y N. SCHADY (2009): "Conditional cash transfers. Reducing present and future poverty", serie de informes de investigación sobre políticas, Banco Mundial. GERTLER, P., S. MARTINEZ, Y M. RUBIO-CODINA (2012): "Investing Cash Transfers to Raise Long-Term Living Standards", American Economic Journal: Applied Economics, 4, 164-92. HAUSHOFER, J. Y J. SHAPIRO (2016): "The Short-term Impact of Unconditional Cash Transfers to the Poor: Experimental Evidence from Kenya*", The Quarterly Journal of Economics, 131, 1973-2042. HERNA´ NDEZ, D., J. GO´ MEZ DE LEO´ N, Y G. VA´ ZQUEZ (1999): "El Programa de Ed- ucación, Salud y Alimentación: orientación y componentes", en Más oportunidades para las familias pobres. Evaluación de resultados del Programa de Educación, Salud y Alimentación, México D.F.: Secretaría de Desarrollo Social, 1-32. HODDINOTT, J., J. A. MALUCCIO, J. R. BEHRMAN, R. FLORES, Y R. MARTORELL (2008): "Effect of a nutrition intervention during early childhood on economic productivity in Guatemalan adults", The Lancet, 371, 411-416. HODDINOTT, J. Y E. SKOUFIAS (2004): "The Impact of PROGRESA on Food Consumption", Economic Development and Cultural Change, 53, 37-61. INEGI (2018): "Índice de Precios al Consumidor", Sitio web. 40 KUGLER, A. Y I. ROJAS (2018): "Do CCTs Improve Employment and Earnings in the Very Long-Term? Evidence from Mexico", Documento de trabajo 24248, National Bureau of Economic Research. LALIVE, R. Y M. A. CATTANEO (2009): "Social Interactions and Schooling Decisions", The Review of Economics and Statistics, 91, 457-477. LEVY, S. (2006): Pobreza y transición democrática en México. La continuidad de Progresa- Oportunidades, Washington, D.C.: Brookings Institution Press. MARTORELL, R. (2017): "Improved nutrition in the first 1000 days and adult human capital and health", American Journal of Human Biology, 29. MCKENZIE, D. (2012): "Beyond baseline and follow-up: The case for more T in experiments", Journal of Development Economics, 99, 210-221. MILLAN, T. M., T. BARHAM, J. MALUCCIO, Y M. STAMPINI (2018): "Long-Term Im- pacts of Conditional Cash Transfers: Review of the Evidence", Rep. tec., HAL. MORETTI, E. (2012): The New Geography of Jobs, Houghton Mifflin Harcourt. NIEHAUS, P., A. ATTANASSOVA, M. BERTRAND, Y S. MULLAINATHAN (2013): "Tar- geting with Agents", American Economic Journal: Economic Policy, 5, 206-238. PARKER, S. Y T. VOGL (2018): "Do Conditional Cash Transfers Improve Economic Outcomes in the Next Generation? Evidence from Mexico". RAVALLION, M. (2011): "On Multidemensional Poverty Indeces", Documento de trabajo de investigación sobre políticas. RUBIN, D. (1987): "Multiple Imputation for Nonresponse in Surveys". SEN, A. (1970): Collective Choice and Social Welfare, San Francisco: Holden Day. ——— (1973): On Economic Inequality, Oxford: Clarendon Press. ——— (1986): "Welfare Economics and the Real World", en Frank Seidman Distinguished Award in Political Economy, Memphis: P.K. Seidman Foundation. ——— (2006): Conceptualizing and Measuring Poverty, Stanford: Stanford University Press. SKOUFIAS, E., B. DAVIS, Y S. DE LA VEGA (2001): "Targeting the Poor in Mexico: An Evaluation of the Selection of Households into PROGRESA", World Development [Desarrollo mundial], 29, 1769-1784. SUMARTO, S., D. SURYADARMA, Y A. SURYAHADI (2007): "Predicting Consumption Poverty using Non-Consumption Indicators: Experiments using Indonesian Data", Investigación sobre indicadores sociales, 81, 543-578. 41 TODD, P. Y K. WOLPIN (2006): "Assessing the Impact of a School Subsidy Program in Mexico: Using a Social Experiment to Validate a Dynamic Behavioral Model of Child Schooling and Fertility", American Economic Review, 96, 1384-1417. VARGAS-CHANES, D. Y F. LORENZ (2015): "Inference with Missing Data Using Latent Growth Curves: an Application to Real Data", ESTADÍSTICA, 67, 935-71. YASCHINE, I. (2012): ¿Oportunidades?: Movilidad Social Intergeneracional e Impacto en México. 42 Anexos A El programa PROSPERA en resumen El programa mexicano Progresa-Oportunidades-PROSPERA (POP) es una referencia básica entre los programas de transferencias monetarias condicionadas (TMC). PROSPERA se creó con el propósito de "fortalecer el cumplimiento de los derechos sociales que fomenten las capacidades de las personas en situación de pobreza a través de acciones que incrementen su educación, salud y nutrición22 (Diario Oficial de la Federación, 2018)". Su fortaleza reside en una sólida base institucional y en un riguroso diseño de evaluación que permite evaluar objetivamente sus resultados bajo altos estándares. 23. Progresa comenzó en agosto de 1997. Hoy en día, es el programa de reducción de la pobreza más completo en México. Para el año 2018, alcanzó una cobertura de 6.9 millones de hogares (20 % de los hogares mexicanos). Para 2018, el presupuesto aprobado para el programa asciende a 46,396 millones de pesos mexicanos (44 % del gasto del gobierno de México en programas sociales) (Diario Oficial de la Federación, 2017). Entre 1997 y 2000, mientras el programa se expandía a nivel nacional, se implementó un diseño de evaluación aleatoria en una submuestra de 506 localidades que inicialmente se determinaron como elegibles para recibir el programa. De las 506 localidades, 320 se determinaron aleatoriamente como tratamiento y 186 como control. Las localidades de control retrasaron su ingreso al programa hasta finales de 1999. El propósito del experimento era estimar rigurosamente el impacto del programa en varias dimensiones (Fizbein y Schady, 2009). En el momento en que el Progresa comenzó, constaba de tres componentes principales: (i) educación, que se promovió mediante transferencias en efectivo a los hogares por cada niño inscrito y que asiste regularmente a la escuela; (ii) nutrición, que consistía en transferencias de efectivo de un monto fijo y la entrega de complementos alimenticios (destinados a los niños y a las mujeres lactantes o embarazadas) entregados a los hogares, que cumplían las condicionalidades de salud y la asistencia a las sesiones informativas; y (iii) salud que consiste en revisiones periódicas requeridas a todos los miembros del hogar, pero con una mayor frecuencia de asistencia de niños menores de 5 años y mujeres embarazadas o en período de lactancia. Además, la jefa de familia debe asistir a sesiones regulares que distribuyen información sobre las buenas prácticas de cuidado de la salud (Hernández et al., 1999). Recientemente, se agregó un cuarto componente, denominado componente de vinculación, que busca establecer vínculos entre los beneficiarios y las actividades productivas. Este cuarto componente incluye orientación, capacitación complementaria, educación financiera, acceso al crédito y al ahorro, etc. 22Traducción del autor del objetivo principal de PROSPERA. 23Se pueden encontrar más detalles sobre la historia y el diseño del programa en Levy (2006) 43 Las transferencias de efectivo (educativas y nutricionales) se entregan a la jefa de familia cada dos meses. Las familias reciben información que les sugiere cómo utilizar las transferencias para mejorar las condiciones de sus integrantes. Sin embargo, en la práctica, los hogares pueden decidir libremente cómo gastar los recursos. B Los Efectos Calibrados a Largo Plazo de un Tratamiento de 20 años La evidencia presentada hasta ahora estima escenarios con exposición diferencial al programa. Sin embargo, estas estrategias no proporcionan una manera de evaluar dos versiones de México: una con y otra sin PROSPERA. Para ello, se sigue el trabajo anterior de Gertler et al. (2012) y se propone el siguiente ejercicio: se plantea la hipótesis de que los hogares tratados reciben transferencias de PROSPERA en función de la evolución de su estructura familiar desde 1998 hasta 2017, y se comparan con los hogares de control hipotéticos, con características similares, que no reciben ninguna transferencia. En la práctica, la idea consiste en tratar de extender el experimento aleatorio original hasta el 2017. Para ello, es necesario imponer algo de estructura adicional, tal como una función de consumo y la evolución de los activos y sus rendimientos a lo largo del tiempo. Se parte de un modelo de consumo estándar en el que el gasto en consumo total es una función del ingreso: ND Chvt = α0 + α1Yhvt (6) CND representa el consumo no duradero del hogar, incluyendo alimentación, productos personales y prendas de vestir, como en Gertler et al. (2012). Aquí, α1 representa la propensión marginal al consumo (PMC) por el ingreso. Dado que no se observa una medida de consumo no duradero en la ENCEL 2017-2018, en esta sección utilizamos los parámetros estimados por Gertler et al. (2012). Definimos la ley de evolución para los activos y los ingresos obtenidos de la siguiente forma: Ahvt = (1 − α1) (Yhv(t−1) + TRhv(t−1)) + (1 − δ)Ahv(t−1) (7) Yhvt = β0 + β1Ahvt + β2Wht. (8) Donde A representa activos, Y el ingreso obtenido, TR son las transferencias del gobierno (PROSPERA), W son los salarios locales, δ es el parámetro de depreciación de bienes. Finalmente, al resolver la ecuación de acumulación de bienes recursivamente, se puede escribir la función de consumo como sigue: 44 t −1 t CND hvt = γ0 + α1TRhvt + Σ γ1sTRhvs + γ2Ahv0 + Σ γ3sWvs. (9) s=0 s=0 De modo que el consumo contemporáneo es una función de las transferencias contemporáneas, las transferencias anteriores (como en el artículo original, los períodos anteriores se dividirán en 3 segmentos largos), el nivel inicial de los bienes Ahv0, y los salarios W. Se emplearon los parámetros estimados en Gertler et al. (2012) para la PMC fuera de los ingresos/transferencias contemporáneos: α1 = 0.74, para los pasados 12 meses, 13-24 meses, y más de 24 meses, se consideraron γ1 = 0.003, γ2 = 0.018, y γ3 = 0.016 respectivamente. Después, aplicamos esas estimaciones a las transferencias reales para calcular los efectos a largo plazo en el consumo no duradero. Este simple ejercicio da una idea de cuáles serían los efectos a largo plazo de PROSPERA si se comparara a individuos tratados completamente contra aquellos que nunca fueron tratados: el consumo no duradero promedio aumentaría en alrededor de 1,100MXN por adulto equivalente en promedio (a precios de 2017), o alrededor del 25 % con respecto a su gasto de consumo anual de referencia en 1997. C Imputación de Consumo Se adapta un modelo desarrollado por Blundell, Pistaferri y Preston (2005, 2008, y (Attanasio y Pistaferri, 2016)) que imputa el gasto en consumo de los hogares con el uso de estimaciones (o aproximaciones) de la función de la demanda teóricamente fundamentadas, basadas en variables presentes consistentemente en los diferentes levantamientos de los datos disponibles de la ENCEL.24 En esencia, se utilizan bienes duraderos, información sociodemográfica (edad, educación y estado civil del jefe de familia, estructura por edad y tamaño del hogar, índice de marginalidad de la localidad y estatus rural), y controles de precios de los alimentos, a nivel anual, como se observa en las series de construcción del INPC del INEGI (INEGI 2018). Se estima una ecuación de demanda estándar para el gasto total no duradero, compuesto por alimentos, productos personales y ropa, cuando todas estas categorías de consumo y gastos se registran en las encuestas. 24Los enfoques relacionados, a veces denominados Métodos de Correlación de Consumo, se emplean en otros contextos: Tanzania (Abeyasekera y Ward 2002), Indonesia (Sumarto et al. 2007). Además, métodos alternativos como los Métodos de Imputación Múltiple (Rubin, 1987) así como en Vargas-Chanes y Lorenz (2015) se pueden usar para probar la robustez. 45 Así, primero se estiman las elasticidades de la demanda y se aplican los parámetros estimados para recuperar los faltantes gastos no duraderos. Como ya se ha mencionado, es un requisito estricto es que todas las variables independientes estén presentes en todos los levantamientos, ya que la imputación se basa en esas variables.25 Por último, se puede validar internamente este enfoque al comparar los gastos imputados con los reales cuando ambos estén disponibles (es decir, en levantamientos anteriores) para juzgar la correspondencia entre las dos medidas de gasto de consumo. Como se puede ver en la Figura C.1 la medida imputada parece funcionar razonablemente bien, ya que el gráfico de dispersión de las medidas imputadas sobre medidas reales se concentra a lo largo de la línea de 45 grados, con concentraciones similares por debajo y por encima de ella. Más adelante, en la Tabla C.1 se muestra que los momentos seleccionados del consumo imputado (los primeros tres cuartiles y la media) coinciden con los de la medida real de consumo de manera razonable, en particular en el caso de la media y la mediana. Más detalladamente. Dado que en la ENCEL 2017 no se dispone de mucha información sobre el gasto en consumo, se utiliza un modelo desarrollado por Blundell et al. (2005) y su versión simplificada (Attanasio y Pistaferri (2016)) para imputar el consumo (total) de los hogares con el uso de una función de demanda derivada de las variables presentes de forma consistente en los levantamientos de la ENCEL. Específicamente, el método utiliza el gasto (o la presencia) de bienes duraderos, información sociodemográfica (edad, educación y estado civil del jefe de familia, estructura por edad y tamaño del hogar, índice de marginalidad de la localidad y estatus rural) y controles de precios a nivel local para predecir el gasto (o las cantidades) en consumo de alimentos, así como otro consumo no duradero (definido como el gasto total en productos personales y ropa). La idea básica es estimar la relación entre las variables de consumo y las variables demográficas y de activos duraderos reportadas consistentemente, y usar esta relación para predecir el gasto en consumo no duradero en la ENCEL 2017. El modelo consiste en la siguiente regresión, utilizando datos de los levantamientos de 1998-1999 (donde se registran todas las variables necesarias): ln(ncit) = Zitβ + ptγ + g (fit; θ) + uit (10) 25Con el fin de mitigar la preocupación habitual por la endogeneidad de los gastos (y potencialmente de los ingresos), se puede utilizar una estrategia IV para los bienes duraderos y/o los ingresos (como predictor de los gastos), tales como las transferencias (potenciales) del gobierno (como en trabajos anteriores del Programa de Apoyo Alimentario (PAL) y la estimación de la demanda (Cunha et al. 2018), también los salarios promedio por género/ubicación (Blundell et al. 2005, y Blundell et al. 2008; Attanasio et al. 2013) son candidatos para instrumentos.) Sin embargo, para mantener una narrativa simple, ya que se considera que este último ejercicio es únicamente una comprobación adicional, se usará el enfoque más simple seguido en la literatura, que se basa en los estimadores MCO. 46 Aquí, ncit indica la medida de consumo no duradero, definida como el gasto total en alimentos, y otros bienes no duraderos definidos anteriormente. Z representa un conjunto de variables dummy para las covariables demográficas: edad, educación y estado civil del jefe de familia, estatus rural y estructura por edad (al menos un miembro de la familia menor de 18 años y uno mayor de 70 años). También se incluyen covariables continuas para el número total de miembros de la familia y el índice de marginalidad de la localidad, y las interacciones de las características demográficas del hogar y los bienes duraderos. Se agrega p para el control de precios: los INPC anuales de los alimentos (los INPC se pueden calcular mediante los datos disponibles o utilizar los oficiales). La función polinómica g(.), incluye un contador de bienes duraderos y el mismo término al cuadrado d (bienes duraderos), y u es un término de error. Una vez estimada la función de demanda para los años 1998-1999, se utilizan los coeficientes estimados (parámetros del sistema de demanda) para predecir el consumo no duradero para todos los levantamientos, incluido el de 2017-2018. Cualquier procedimiento de imputación puede resultar problemático a cierto nivel. Sin embargo, el elegido se basa en la teoría del comportamiento del consumidor en lugar de ser un mero ejercicio estadístico. La ventaja de este enfoque consiste en que trata de tomar en cuenta explícitamente los factores clave que deberían dirigir los perfiles de consumo, como la demografía, el ingreso y los precios. La utilidad de este procedimiento consiste en que se puede proporcionar un indicador sintético para el bienestar de los hogares en lugar de presentar evidencia sobre las diversas variables que se utilizan para la imputación. 47 Figura C.1: Gráfica de dispersión de gasto en consumo real contra gasto en consumo imputado. Esta gráfica muestra el diagrama de dispersión de los gastos imputados contra el gasto en consumo real transformado logarítmicamente. La medida para el consumo incluye el gasto en bienes no duraderos (alimentos, tabaco y productos de higiene) y semi duraderos (ropa, juguetes y utensilios de cocina). Los datos utilizados para estas estimaciones proceden de la ENCEL de octubre de 1998 y mayo de 1999. Las observaciones se restringen a los hogares en los percentiles 3° al 98° de gasto en consumo. Tabla C.1: Momentos de consumo real e imputado. media c1 c2 c3 ln(gasto en consumo) 8.899 8.551 8.925 9.278 predicción 8.899 8.736 8.895 9.076 Observaciones 40,763 Los datos utilizados para estas estimaciones proceden de la ENCEL de octubre de 1998 y mayo de 1999. Las observaciones se limitan a los hogares que se encuentran en los percentiles 2.° a 99.° del gasto en consumo. 48