from IPython.core.display import HTML
HTML("""
<style>
.output_png {
    display: table-cell;
    text-align: center;
    vertical-align: middle;
}
</style>
""")


import pandas as pd                         # data wrangling
import matplotlib.pyplot as plt             # plotting
import seaborn as sns                       # plotting 2.0
import re                                   # format text
from wordcloud import WordCloud, STOPWORDS  # text analysis
from unidecode import unidecode             # remove accents
import numpy as np                          # numerical manipulations


df = pd.read_csv("../data/Percepciones sobre ciencia y ciencia abierta.csv")


pd.set_option('max_columns', None) # display all columns
pd.set_option('display.max_colwidth', None) # display full column information


df.head()


df.shape

(95, 53)


column_names = {"Timestamp": "timestamp",
                "¿Acepta participar?": "consent",
                "Edad (años)": "age",
                "Nivel educativo alcanzado": "education",
                "Área/s de investigación": "area",
                "¿Ha participado en un proyecto de investigación (v. g., UBACyT, CONICET) en los últimos 5 años?": "project",
                "¿Ha publicado en una revista indexada con referato (v. g., Scopus, Scimago, Scielo) en los últimos 5 años?": "journal",
                "Marque su posición actual en la Facultad de Psicología de la UBA": "position",
                "¿Qué tipo de metodología suele predominar en sus estudios?": "methodology",
                "¿Cree que hay una crisis en la ciencia?": "belief",
                "Si su respuesta a la pregunta anterior ha sido “Sí”, señale por qué cree que hay una crisis en la ciencia": "belief_comments",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Gran parte de los investigadores solamente publica los estudios en donde obtienen diferencias estadísticamente significativas]": "Gran parte de los investigadores solamente publica los estudios en donde obtienen diferencias estadísticamente significativas",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [A las revistas científicas no les interesa publicar resultados que no son estadísticamente significativos]": "A las revistas científicas no les interesa publicar resultados que no son estadísticamente significativos",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Cuando leo un artículo tengo mayor confianza en la calidad del estudio si los resultados son estadísticamente significativos]": "Cuando leo un artículo tengo mayor confianza en la calidad del estudio si los resultados son estadísticamente significativos",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Que un resultado no fuera estadísticamente significativo sería un criterio para no seguir investigando esas variables]": "Que un resultado no fuera estadísticamente significativo sería un criterio para no seguir investigando esas variables",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Una conclusión científica (por ejemplo, si un tratamiento es mejor que otro) debe estar basado en si el p-valor es o no es estadísticamente significativo]": "Una conclusión científica (por ejemplo, si un tratamiento es mejor que otro) debe estar basado en si el p-valor es o no es estadísticamente significativo",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Un resultado estadísticamente significativo es un resultado importante]": "Un resultado estadísticamente significativo es un resultado importante",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [El valor de p < .05 confirma que el hallazgo será útil para la comunidad científica]": "El valor de p < .05 confirma que el hallazgo será útil para la comunidad científica",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [El valor de p = .001 confirma que el tamaño del efecto ha sido grande]": "El valor de p = .001 confirma que el tamaño del efecto ha sido grande",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Cuando los resultados de diferentes investigadores son contradictorios entonces sería necesario llevar a cabo un estudio de replicación sobre la misma temática]": "Cuando los resultados de diferentes investigadores son contradictorios entonces sería necesario llevar a cabo un estudio de replicación sobre la misma temática",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [La realización de estudios de replicación es necesaria para el avance de la ciencia]": "La realización de estudios de replicación es necesaria para el avance de la ciencia",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Si los resultados sobre una determinada temática son unánimes por parte de diferentes equipos de investigación entonces los estudios de replicación no son necesarios]": "Si los resultados sobre una determinada temática son unánimes por parte de diferentes equipos de investigación entonces los estudios de replicación no son necesarios",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Los estudios de replicación solamente tienen sentido cuando no se detectan diferencias estadísticamente significativas en el estudio original]": "Los estudios de replicación solamente tienen sentido cuando no se detectan diferencias estadísticamente significativas en el estudio original",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [No es necesario replicar un estudio cuando ya se detectaron efectos estadísticamente significativos en el estudio original]": "No es necesario replicar un estudio cuando ya se detectaron efectos estadísticamente significativos en el estudio original",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [El principal objetivo de las revistas científicas es publicar hallazgos novedosos]": "El principal objetivo de las revistas científicas es publicar hallazgos novedosos",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [La ciencia avanza más con estudios que plantean hipótesis novedosas que con estudios de replicación de otras investigaciones]": "La ciencia avanza más con estudios que plantean hipótesis novedosas que con estudios de replicación de otras investigaciones",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Creo que, en general, los errores que se pueden haber cometido en un estudio científico siempre se detectan y corrigen antes de ser publicados]": "Creo que, en general, los errores que se pueden haber cometido en un estudio científico siempre se detectan y corrigen antes de ser publicados",
                "Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Las tareas de revisión y corrección de los manuscritos que llevan a cabo los revisores de las revistas garantizan de forma fiable la calidad de los resultados científicos]": "Las tareas de revisión y corrección de los manuscritos que llevan a cabo los revisores de las revistas garantizan de forma fiable la calidad de los resultados científicos",
                " [Replicar un estudio previo]": "Replicar un estudio previo (1)",
                " [Pre-registrar un estudio antes de iniciar la recolección de datos]": "Pre-registrar un estudio antes de iniciar la recolección de datos (1)",
                " [Poner datos recolectados a disposición mediante plataformas o repositorios públicos.]": "Poner datos recolectados a disposición mediante plataformas o repositorios públicos (1)",
                " [Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos]": "Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos (1)",
                " [Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos]": "Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos (1)",
                " [Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio]": "Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio (1)",
                " [Compartir una pre-impresión (pre-print) publicándola en un repositorio público o semi-público]": "Compartir una pre-impresión (pre-print) publicándola en un repositorio público o semi-público (1)",
                " [Usar revisión por pares abierta]": "Usar revisión por pares abierta (1)",
                " [Publicar en revistas de acceso abierto]": "Publicar en revistas de acceso abierto (1)",
                " [Adaptar un test psicométrico]": "Adaptar un test psicométrico (1)",
                " [Participar en proyectos abiertos y colaborativos a gran escala]": "Participar en proyectos abiertos y colaborativos a gran escala (1)",
                " [Replicar un estudio previo].1": "Replicar un estudio previo (2)",
                " [Pre-registrar un estudio antes de iniciar la recolección de datos].1": "Pre-registrar un estudio antes de iniciar la recolección de datos (2)",
                " [Poner datos recolectados a disposición mediante plataformas o repositorios públicos]": "Poner datos recolectados a disposición mediante plataformas o repositorios públicos (2)",
                " [Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos].1": "Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos (2)",
                " [Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos].1": "Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos (2)",
                " [Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio].1": "Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio (2)",
                " [Compartir una pre-impresión (pre-print) publicándola en un repositorio de confianza]": "Compartir una pre-impresión (pre-print) publicándola en un repositorio de confianza (2)",
                " [Usar revisión por partes abierta]": "Usar revisión por partes abierta (2)",
                " [Publicar en revistas de acceso abierto].1": "Publicar en revistas de acceso abierto (2)",
                " [Adaptar un test psicométrico].1": "Adaptar un test psicométrico (2)",
                " [Participar en proyectos abiertos y colaborativos a gran escala].1": "Participar en proyectos abiertos y colaborativos a gran escala (2)",
                "¿Cuáles le parecen que son las mayores barreras para la aceptación y puesta en práctica de prácticas de ciencia abierta en su campo y/o lugar de trabajo?": "barriers_1",
                "Si aplica, por favor describa brevemente qué barreras ha experimentado para incorporar o mantener prácticas de ciencia abierta": "barriers_2",
                "Por último, si posee alguna idea o comentario respecto a esta encuesta o al tema que aborda, por favor escribalo brevemente a continuación ": "comments"
               }

df.rename(columns = column_names, inplace=True)
df.timestamp = pd.to_datetime(df.timestamp)
df.age = [re.sub(r"[a-zñ]+", "", i) for i in df["age"]] # remove " años" in values, to convert them in integers
df.age = pd.to_numeric(df.age, downcast="integer")


df.dtypes

timestamp                                                                                                                                                                     datetime64[ns, pytz.FixedOffset(180)]
consent                                                                                                                                                                                                      object
age                                                                                                                                                                                                            int8
education                                                                                                                                                                                                    object
area                                                                                                                                                                                                         object
project                                                                                                                                                                                                      object
journal                                                                                                                                                                                                      object
position                                                                                                                                                                                                     object
methodology                                                                                                                                                                                                  object
belief                                                                                                                                                                                                       object
belief_comments                                                                                                                                                                                              object
Gran parte de los investigadores solamente publica los estudios en donde obtienen diferencias estadísticamente significativas                                                                                object
A las revistas científicas no les interesa publicar resultados que no son estadísticamente significativos                                                                                                    object
Cuando leo un artículo tengo mayor confianza en la calidad del estudio si los resultados son estadísticamente significativos                                                                                 object
Que un resultado no fuera estadísticamente significativo sería un criterio para no seguir investigando esas variables                                                                                        object
Una conclusión científica (por ejemplo, si un tratamiento es mejor que otro) debe estar basado en si el p-valor es o no es estadísticamente significativo                                                    object
Un resultado estadísticamente significativo es un resultado importante                                                                                                                                       object
El valor de p < .05 confirma que el hallazgo será útil para la comunidad científica                                                                                                                          object
El valor de p = .001 confirma que el tamaño del efecto ha sido grande                                                                                                                                        object
Cuando los resultados de diferentes investigadores son contradictorios entonces sería necesario llevar a cabo un estudio de replicación sobre la misma temática                                              object
La realización de estudios de replicación es necesaria para el avance de la ciencia                                                                                                                          object
Si los resultados sobre una determinada temática son unánimes por parte de diferentes equipos de investigación entonces los estudios de replicación no son necesarios                                        object
Los estudios de replicación solamente tienen sentido cuando no se detectan diferencias estadísticamente significativas en el estudio original                                                                object
No es necesario replicar un estudio cuando ya se detectaron efectos estadísticamente significativos en el estudio original                                                                                   object
El principal objetivo de las revistas científicas es publicar hallazgos novedosos                                                                                                                            object
La ciencia avanza más con estudios que plantean hipótesis novedosas que con estudios de replicación de otras investigaciones                                                                                 object
Creo que, en general, los errores que se pueden haber cometido en un estudio científico siempre se detectan y corrigen antes de ser publicados                                                               object
Las tareas de revisión y corrección de los manuscritos que llevan a cabo los revisores de las revistas garantizan de forma fiable la calidad de los resultados científicos                                   object
Replicar un estudio previo (1)                                                                                                                                                                               object
Pre-registrar un estudio antes de iniciar la recolección de datos (1)                                                                                                                                        object
Poner datos recolectados a disposición mediante plataformas o repositorios públicos (1)                                                                                                                      object
Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos (1)                                                                                                      object
Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos (1)                                                                                    object
Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio (1)                                                                                                 object
Compartir una pre-impresión (pre-print) publicándola en un repositorio público o semi-público (1)                                                                                                            object
Usar revisión por pares abierta (1)                                                                                                                                                                          object
Publicar en revistas de acceso abierto (1)                                                                                                                                                                   object
Adaptar un test psicométrico (1)                                                                                                                                                                             object
Participar en proyectos abiertos y colaborativos a gran escala (1)                                                                                                                                           object
Replicar un estudio previo (2)                                                                                                                                                                               object
Pre-registrar un estudio antes de iniciar la recolección de datos (2)                                                                                                                                        object
Poner datos recolectados a disposición mediante plataformas o repositorios públicos (2)                                                                                                                      object
Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos (2)                                                                                                      object
Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos (2)                                                                                    object
Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio (2)                                                                                                 object
Compartir una pre-impresión (pre-print) publicándola en un repositorio de confianza (2)                                                                                                                      object
Usar revisión por partes abierta (2)                                                                                                                                                                         object
Publicar en revistas de acceso abierto (2)                                                                                                                                                                   object
Adaptar un test psicométrico (2)                                                                                                                                                                             object
Participar en proyectos abiertos y colaborativos a gran escala (2)                                                                                                                                           object
barriers_1                                                                                                                                                                                                   object
barriers_2                                                                                                                                                                                                   object
comments                                                                                                                                                                                                     object
dtype: object


df.columns

Index(['timestamp', 'consent', 'age', 'education', 'area', 'project',
       'journal', 'position', 'methodology', 'belief', 'belief_comments',
       'Gran parte de los investigadores solamente publica los estudios en donde obtienen diferencias estadísticamente significativas',
       'A las revistas científicas no les interesa publicar resultados que no son estadísticamente significativos',
       'Cuando leo un artículo tengo mayor confianza en la calidad del estudio si los resultados son estadísticamente significativos',
       'Que un resultado no fuera estadísticamente significativo sería un criterio para no seguir investigando esas variables',
       'Una conclusión científica (por ejemplo, si un tratamiento es mejor que otro) debe estar basado en si el p-valor es o no es estadísticamente significativo',
       'Un resultado estadísticamente significativo es un resultado importante',
       'El valor de p < .05 confirma que el hallazgo será útil para la comunidad científica',
       'El valor de p = .001 confirma que el tamaño del efecto ha sido grande',
       'Cuando los resultados de diferentes investigadores son contradictorios entonces sería necesario llevar a cabo un estudio de replicación sobre la misma temática',
       'La realización de estudios de replicación es necesaria para el avance de la ciencia',
       'Si los resultados sobre una determinada temática son unánimes por parte de diferentes equipos de investigación entonces los estudios de replicación no son necesarios',
       'Los estudios de replicación solamente tienen sentido cuando no se detectan diferencias estadísticamente significativas en el estudio original',
       'No es necesario replicar un estudio cuando ya se detectaron efectos estadísticamente significativos en el estudio original',
       'El principal objetivo de las revistas científicas es publicar hallazgos novedosos',
       'La ciencia avanza más con estudios que plantean hipótesis novedosas que con estudios de replicación de otras investigaciones',
       'Creo que, en general, los errores que se pueden haber cometido en un estudio científico siempre se detectan y corrigen antes de ser publicados',
       'Las tareas de revisión y corrección de los manuscritos que llevan a cabo los revisores de las revistas garantizan de forma fiable la calidad de los resultados científicos',
       'Replicar un estudio previo (1)',
       'Pre-registrar un estudio antes de iniciar la recolección de datos (1)',
       'Poner datos recolectados a disposición mediante plataformas o repositorios públicos (1)',
       'Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos (1)',
       'Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos (1)',
       'Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio (1)',
       'Compartir una pre-impresión (pre-print) publicándola en un repositorio público o semi-público (1)',
       'Usar revisión por pares abierta (1)',
       'Publicar en revistas de acceso abierto (1)',
       'Adaptar un test psicométrico (1)',
       'Participar en proyectos abiertos y colaborativos a gran escala (1)',
       'Replicar un estudio previo (2)',
       'Pre-registrar un estudio antes de iniciar la recolección de datos (2)',
       'Poner datos recolectados a disposición mediante plataformas o repositorios públicos (2)',
       'Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos (2)',
       'Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos (2)',
       'Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio (2)',
       'Compartir una pre-impresión (pre-print) publicándola en un repositorio de confianza (2)',
       'Usar revisión por partes abierta (2)',
       'Publicar en revistas de acceso abierto (2)',
       'Adaptar un test psicométrico (2)',
       'Participar en proyectos abiertos y colaborativos a gran escala (2)',
       'barriers_1', 'barriers_2', 'comments'],
      dtype='object')


exclusion_criteria = df[["project", "journal"]]
excluded = []
        
for (i, (a, b)) in enumerate(exclusion_criteria.itertuples(index=False), start=0):
    if a == "No" and b == "No":
        print(f"Participant n° {i} will be excluded")
        excluded.append(i)

df = df.drop(excluded, axis=0)

Participant n° 20 will be excluded
Participant n° 26 will be excluded
Participant n° 64 will be excluded
Participant n° 78 will be excluded
Participant n° 80 will be excluded


df.shape

(90, 53)


df["education"]

0                     Licenciado
1                      Doctorado
2                      Doctorado
3                      Doctorado
4                      Doctorado
                 ...            
90                    Licenciado
91      Especialización;Maestría
92    Estudiante de licenciatura
93                     Doctorado
94                     Doctorado
Name: education, Length: 90, dtype: object


def horizontal_bar_plot(serie, title=None):
    y = serie.value_counts(ascending=True)
    fig, ax = plt.subplots(figsize=(20,15))
    ax.tick_params(labelsize=20)
    ax.barh(y.index, y, height=0.75)
    ax.set_title(title, fontsize=20)
    ax.set_xlabel("Researchers", fontsize=20)
    ax.set_ylabel("Frecuency", fontsize=20)
    _, xmax = plt.xlim()
    plt.xlim(0, xmax)
    for i, v in enumerate(y):
        ax.text(v + .5, i, str(v), fontsize=20, ha='left', va='center')
    plt.show()


horizontal_bar_plot(df["education"], "Education")


education_df = df[["education", 
                   "belief",
                   'Gran parte de los investigadores solamente publica los estudios en donde obtienen diferencias estadísticamente significativas',
                   'A las revistas científicas no les interesa publicar resultados que no son estadísticamente significativos',
                   'Cuando leo un artículo tengo mayor confianza en la calidad del estudio si los resultados son estadísticamente significativos',
                   'Que un resultado no fuera estadísticamente significativo sería un criterio para no seguir investigando esas variables',
                   'Una conclusión científica (por ejemplo, si un tratamiento es mejor que otro) debe estar basado en si el p-valor es o no es estadísticamente significativo',
                   'Un resultado estadísticamente significativo es un resultado importante',
                   'El valor de p < .05 confirma que el hallazgo será útil para la comunidad científica',
                   'El valor de p = .001 confirma que el tamaño del efecto ha sido grande',
                   'Cuando los resultados de diferentes investigadores son contradictorios entonces sería necesario llevar a cabo un estudio de replicación sobre la misma temática',
                   'La realización de estudios de replicación es necesaria para el avance de la ciencia',
                   'Si los resultados sobre una determinada temática son unánimes por parte de diferentes equipos de investigación entonces los estudios de replicación no son necesarios',
                   'Los estudios de replicación solamente tienen sentido cuando no se detectan diferencias estadísticamente significativas en el estudio original',
                   'No es necesario replicar un estudio cuando ya se detectaron efectos estadísticamente significativos en el estudio original',
                   'El principal objetivo de las revistas científicas es publicar hallazgos novedosos',
                   'La ciencia avanza más con estudios que plantean hipótesis novedosas que con estudios de replicación de otras investigaciones',
                   'Creo que, en general, los errores que se pueden haber cometido en un estudio científico siempre se detectan y corrigen antes de ser publicados',
                   'Las tareas de revisión y corrección de los manuscritos que llevan a cabo los revisores de las revistas garantizan de forma fiable la calidad de los resultados científicos',
                   'Replicar un estudio previo (1)',
                   'Pre-registrar un estudio antes de iniciar la recolección de datos (1)',
                   'Poner datos recolectados a disposición mediante plataformas o repositorios públicos (1)',
                   'Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos (1)',
                   'Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos (1)',
                   'Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio (1)',
                   'Compartir una pre-impresión (pre-print) publicándola en un repositorio público o semi-público (1)',
                   'Usar revisión por pares abierta (1)',
                   'Publicar en revistas de acceso abierto (1)',
                   'Adaptar un test psicométrico (1)',
                   'Participar en proyectos abiertos y colaborativos a gran escala (1)',
                   'Replicar un estudio previo (2)',
                   'Pre-registrar un estudio antes de iniciar la recolección de datos (2)',
                   'Poner datos recolectados a disposición mediante plataformas o repositorios públicos (2)',
                   'Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos (2)',
                   'Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos (2)',
                   'Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio (2)',
                   'Compartir una pre-impresión (pre-print) publicándola en un repositorio de confianza (2)',
                   'Usar revisión por partes abierta (2)',
                   'Publicar en revistas de acceso abierto (2)',
                   'Adaptar un test psicométrico (2)',
                   'Participar en proyectos abiertos y colaborativos a gran escala (2)'
                 ]].assign(education=df["education"].str.split(";")).explode("education").reset_index(drop=True)


education_df


def replace_columns(df, column_to_replace, original, replaced):
    """
    Returns: a df and its columns with strings replaced. 
    """
    for col in [column_to_replace]:
        df[col] = df[col].str.replace(original, replaced)
    
replace_columns(education_df, "education", "Licenciado", "Licenciatura")
replace_columns(education_df, "education", "Estudiante de licenciatura", "Licenciatura")
replace_columns(education_df, "education", "estudiante de doctorado", "Doctorado")
replace_columns(education_df, "education", "Doctorado en curso", "Doctorado")
replace_columns(education_df, "education", "Estudiante de Doctorado", "Doctorado")
replace_columns(education_df, "education", "En proceso de tesis de maestría", "Maestría")
replace_columns(education_df, "education", "Postdoctorado", "Doctorado")


def vertical_bar_plot(df, serie, title=None):
    plt.figure(figsize=(15,10))
    ax = df.groupby(serie).size().sort_values(ascending=False).plot.bar()
    ax.set_title(title)
    ax.set_xlabel("Researchers")
    ax.set_ylabel("Frecuency")
    def add_value_labels(ax, spacing=5):
        for rect in ax.patches:
            y_value = rect.get_height()
            x_value = rect.get_x() + rect.get_width() / 2
            space = spacing
            va = 'bottom'
            if y_value < 0:
                space *= -1
                va = 'top'
            label = y_value
            ax.annotate(
                label,                      
                (x_value, y_value),         
                xytext=(0, space),          
                textcoords="offset points", 
                ha='center',                
                va=va) 
    add_value_labels(ax)
    plt.xticks(rotation=0)


vertical_bar_plot(education_df, "education", "Education")


def extract_text(serie):
    serie.dropna(inplace=True)
    serie = serie.apply(unidecode).str.casefold().reset_index(drop=True)
    text = " ".join(text for text in serie)
    return text


def make_worldcloud(data, stopwords=None):
    wordcloud=WordCloud(
        background_color='white',
        stopwords=stopwords,
        max_words=800,
        max_font_size=800, 
        width=800, height=800,
        random_state=0
        ).generate(data)
    plt.figure(figsize = (12,15), facecolor=None) 
    plt.imshow(wordcloud) 
    plt.axis("off") 
    plt.tight_layout(pad = 0) 
    return plt.show()


make_worldcloud(extract_text(df["area"]))


make_worldcloud(extract_text(df["area"]), ["psicologia", "y", "la", "de"])


horizontal_bar_plot(df["position"])


position_df = df[["position", "belief"]].assign(position=df["position"].str.split(";")).explode("position").reset_index(drop=True)


horizontal_bar_plot(position_df["position"])


position_df.loc[position_df['position'].isin((position_df['position'].value_counts()[position_df['position'].value_counts() == 1]).index), 'position'] = 'Other'


horizontal_bar_plot(position_df["position"])


df["methodology"].value_counts().plot.pie(figsize = (10,5), autopct='%1.0f%%', fontsize=20)

<AxesSubplot:ylabel='methodology'>


df["age"].describe()

count    90.000000
mean     37.344444
std      12.667007
min      20.000000
25%      28.000000
50%      35.000000
75%      42.750000
max      82.000000
Name: age, dtype: float64


sns.distplot(df['age'])

/Library/Frameworks/Python.framework/Versions/3.10/lib/python3.10/site-packages/seaborn/distributions.py:2619: FutureWarning: `distplot` is a deprecated function and will be removed in a future version. Please adapt your code to use either `displot` (a figure-level function with similar flexibility) or `histplot` (an axes-level function for histograms).
  warnings.warn(msg, FutureWarning)

<AxesSubplot:xlabel='age', ylabel='Density'>


df["belief"].value_counts().plot.pie(title="Do you believe that there is a crisis in science?", 
                                     figsize = (10,5), 
                                     autopct = "%1.0f%%", 
                                     fontsize = 20)

<AxesSubplot:title={'center':'Do you believe that there is a crisis in science?'}, ylabel='belief'>


plt.figure(figsize=(15,10))
sns.countplot(x='education', hue='belief', data=education_df)

<AxesSubplot:xlabel='education', ylabel='count'>


plt.figure(figsize=(15,10))
sns.countplot(x='position', hue='belief', data=position_df)

<AxesSubplot:xlabel='position', ylabel='count'>


sns.countplot(x="methodology", hue="belief", data=df)

<AxesSubplot:xlabel='methodology', ylabel='count'>


x, y = 'methodology', "belief"
df1 = df.groupby(x)[y].value_counts(normalize=True)
df1 = df1.mul(100)
df1 = df1.rename('percent').reset_index()
g = sns.catplot(x=x,
                y='percent',
                hue=y,
                kind='bar',
                data=df1,
                height=5, 
                hue_order=["No", "Sí"],
                aspect=2)

for ax in g.axes.ravel():
  for p in ax.patches:
    ax.annotate(format(p.get_height(), '.2f'), (p.get_x() + p.get_width() / 2.,
        p.get_height()), ha = 'center', va = 'center', xytext = (0, 10), 
        textcoords = 'offset points')


sns.boxplot(data=df, x='belief', y='age')

<AxesSubplot:xlabel='belief', ylabel='age'>


make_worldcloud(extract_text(df["belief_comments"]))


make_worldcloud(extract_text(df["belief_comments"]), ["que", "la", "y", "por", "porque", "en", "el", "para", "de", "se", "lo"
                                                      , "a", "como", "tambien", "los", "las", "del", "hay", "una", "pero", 
                                                      "esta", "ciencia", "investigadores", "investigacion", "no", "su", "un", 
                                                      "con", "al", "e", "mucha", "crisis", "o", "es", "cientifico"])


belief_comments_df = df["belief_comments"].dropna().apply(unidecode).str.casefold().to_frame().reset_index(drop=True)


belief_comments_df["belief_comments"].count()

50


l = [text for text in belief_comments_df["belief_comments"]]


for (i, text) in enumerate(l):
    print('Comment %d:\n'%(i+1), text)

Comment 1:
 financiamiento 
Comment 2:
 porque se obliga a publicar en detrimento de la calidad o la relevancia
Comment 3:
 por que existe un sistema de evaluacion de cyt que no se ajusta a nuestro contexto y a los problemas cognitivos regionales, por lo que los actores del sistema cientifico terminan haciendo ciencia con miras al exterior. 
Comment 4:
 entiendo que los desarrollos tecnologicos colisionan con la falta de reflexion filosofica sobre sus alcances, generando situaciones que podrian entenderse como criticas. el ejemplo mas claro de ello esta vinculado a la utilizacion de redes sociales
Comment 5:
 porque investigar se vuelve muy dificil cuando quienes se dedican a esta actividad tienen que tener otros empleos para tener un sueldo que medianamente les permita vivir. 
Comment 6:
 por la falta de replicabilidad de los estudios.
Comment 7:
 los motivos son varios. en primer lugar a nivel local, los salarios son bajos y los investigadores debemos realizar muchas tareas docentes para tener ingresos, lo que si bien enriquece la ensenanza, saca disponibilidad de tiempo y energia para investigar. por otro lado, los organismos dedicados a la investigacion a veces se rigen por criterios no del todo claros en relacion a la aprobacion de proyectos, becas, ingresos y ascensos, lo que hace que las condiciones laborales sean en ocasiones inciertas y sometidas a mucha exigencia de un alto rendimiento. estoy de acuerdo con el alto rendimiento, pero con un sueldo acorde y criterios claros. a su vez, el rendimiento se mide por la publicacion de articulos en revistas con buena indexacion en ingles, lo cual hace que el trabajo realizado con poblacion local, muchas veces no se difunda en el pais, perdiendo su valor ya que son investigaciones subsidiadas por el estado. esto hace que se genere en una desconexion entre el area de investigacion y aplicacion. aunque los investigadores lo intentemos, la burocracia de los organismos en los que nos desempenamos impiden trasladar lo investigado de manera aplicada. me parece bien publicar muchos trabajos de calidad, pero que solo sirvan para mantener los trabajos y engrosar el cv hace que muchos investigadores estemos desmotivados (conozco muchos casos). 
otro punto, en funcion de las encuestas que estan a continuacion, es que las revistas solo quieren publicar temas novedosos y algunas solo de determinados paises de origen. tambien esta el tema de que muchas son una "estafa a la ciencia" porque se puede publicar rapido con fees altos, y otras tienen renombre pero entre los investigadores sabemos que son malas. todo esto deriva en que los estudiantes y profesionales que no esten muy al tanto de cuestiones de investigacion, tomen articulos como buenos y utilicen la informacion de sus trabajos sin saber que los autores pagaron para publicar o que la revista es de dudosa seriedad, y asi de difunde informacion poco confiable como "ciencia".
Comment 8:
 seria interesante poder ofrecer mas becas de investigacion a los estudiantes de grado y posgrado. 
Comment 9:
 creo que hay una crisis en el sistema cientifico mas que en la ciencia. se esta empezando a criticar cada vez mas que se considera el producto de la ciencia (papers, tecnologias, tratamientos?) y a quien beneficia esa produccion, asi como evaluacion de la misma. creo que tambien comienza a entrar de a poco en crisis la aceptacion pasiva de las condiciones laborales por parte de quienes hacemos ciencia.
Comment 10:
 hay un agotamiento del mundo moderno que funda el conocimiento cientifico como lo conocemos
Comment 11:
 hablando especificamente del campo de investigacion en psicologia social y politica existe una crisis que se debe a las bajas publicaciones de estudios de replicabilidad y los resultados desalentadores en los pocos estudios que existen.
a un nivel mas transversal la academia, debido a motivos politicos y economicos, posee diversos problemas que dificultan la creacion de una ciencia transparente, robusta, significativa y de una calidad superior (e.g preferencia de mayor volumen sacrificando calidad debido a politicas apoyando el publish or perish).
Comment 12:
 porque hay una escena que esta dando lugar a "otras mentalidades" o paisajes
Comment 13:
 poca inversion en ciencia y tecnologia 
Comment 14:
 crisis en relacion a elementos criticables dentro de los sistemas de publicacion, ademas de aspectos metodologicos (como crisis de replicabilidad)
Comment 15:
 por los intereses economicos, que provocan competencia desleal y adulteracion de los resultados.
Comment 16:
 en argentina la dificultad de acceder a buenos puestos en investigacion hacen que muy poca gente quiera dedicarse al area. asimismo, las fallas en la comunicacion y divulgacion hacen que se vuelva un contenido puramente academico, lo que puede influenciar negativamente en la proliferacion de informacion falsa o acientifica en la comunidad. 
Comment 17:
 problemas en la operacionalizacion de variables y la validez ecologica que no permite buenos resultados en la replicabilidad
Comment 18:
 porque los resultados de la investigacion financiada con fondos publicos deberian ser accesibles a todos y no usados para negocio de las editoriales. muchas veces ni los investigadores tenemos acceso a publicaciones.
Comment 19:
 porque aun el estado esta en deuda con el desarrollo. aunque se han producido mejoras, sobre todo en nuestras disciplinas, hay una carencia de apoyos y visibilizacion en la sociedad.
Comment 20:
 por la perdida de hegemonia del modelo de ciencia moderna y su perspectiva eurocentrica
Comment 21:
 por que la ciencia ha desestimado los datos que la subjetividad ha mostrado sin cesar y el alcance que esta tiene en la salud publica y mental
Comment 22:
 distinguiria ciencia como sistema de creencias de practica cientifica como el habitus de una comunidad cientifica en un contexto socio-cultural-geografico determinado. la mercantilizacion de la ciencia atane a dichas practicas, mas que a los criterios de descubrimiento y validacion de la creencia cientifica. de cualquier modo, considero que la ciencia es una practica social como cualquier otra practica humana.
Comment 23:
 no me parece bien formulada la pregunta. no hay una crisis, las crisis forman parte de la ciencia
Comment 24:
 replicabilidad - teorias - metodos de analisis

Comment 25:
 la flexibilizacion laboral de la investigacion y la reduccion de la investigacion a tecnociencias.
Comment 26:
 la crisis en la ciencia proviene tanto desde el exterior como desde el interior. en el exterior, la ciencia esta dejando de constituir un discurso con valor social que permita tomar y/o justificar decisiones, tanto individuales como colectivas. en el interior, los principios de rentabilidad y de ganancia han comenzado a superponerse al interes por el descubrimiento y por el conocimiento en si mismo. del mismo modo, al menos en la investigacion psicologica local, se ha dejado de construir conocimiento con el objetivo de responder a las demandas sociales, lo que produjo una significativa disociacion entre "legos" y "expertos". por ultimo, la logica de las carreras de investigacion y de los puestos de investigacion tambien hacen parte a la crisis de la ciencia. hay un mandato de publicar de manera sistematica para mantener puestos de poca duracion y mal pagados, lo que deja a los investigadores en una posicion de mucha vulnerabilidad.
Comment 27:
 por un lado, por la representacion a nivel social que hay sobre la produccion del conocimiento. por otro lado, por la manera y el formato en la que la informacion producida en contexto de investigacion se vehiculiza a traves de los diferentes medios de comunicacion y redes sociales.
Comment 28:
 particularmente en psicologia hay una clara crisis de replicabilidad. en cuanto a la ciencia en general hay problemas en la falta de acceso universal a trabajos cientificos, que tiene que ser suplido por herramientas como scihub (entre otros problemas).
Comment 29:
 especificamente en toodas las ciencias del comportamiento, aunque se adopte el metodo cientifico, hay serios problemas a nivel modelado e implementacion que impiden ligar correctamente la data con las teorias o programas de investigacion.
Comment 30:
 crisis en cuano a replicabilidad (pocos experimentos replicados, incluso aquellos cuyos resultados son altamente importantes para el campo).
Comment 31:
 no existe un financiamiento adecuado para propiciar grandes investigaciones. en la mayoria de las investigaciones suele haber muchos profesionales no pagos. lo que genere que se abandone la especificididad en el area.
Comment 32:
 si, pero no en un sentido peyorativo. la ciencia es un campo de disputa en la que diversos discursos se contraponen. en los ultimos anos, por un lado, surgieron nuevos paradigmas que posibilitan estudiar procesos sociales en territorio, que no se ajustan al estereotipo que se tiene de un "cientifico". a su vez, tambien se convive con un desprestigio del saber cientifico, intentando relativizar su importancia e instalando discursos que podrian llamarse anticientificos o pseudocientificos.
Comment 33:
 he leido que en numerosas ocasiones companerxs que llevan adelante investigaciones y las publican, luego no tienen acceso a su propia publicacion, porque se trata de sistemas en los que hay que tener permisos y credenciales pagas para acceder, restringiendo asi su capacidad de dar a conocer sus hallazgos de manera informal o por cuenta propia
Comment 34:
 al menos en el contexto local, la falta de recursos para investigar tanto en investigacion de resultados como de procesos, lleva a que los investigadores (ya sea jovenes como expertos) inicien y sostengan proyectos de investigacion que se acomodan a las condiciones economicas y de recursos disponibles, en vez de seguir lineas de trabajo que permitan responder interrogantes sobre la practica profesional que no estan estudiadas en nuestro contexto y hacen falta para mejorar la experticia y la calidad de tratamientos brindados a la poblacion.
Comment 35:
 siempre la ciencia esta en crisis
Comment 36:
 porque la oferta laboral (becas principalmente) es escasa y la inversion en ciencia no es la suficientemente para que los investigadores puedan tener los recursos que necesitan para investigar 
Comment 37:
 por los cambios de paradigmas
Comment 38:
 porque el sistema es militante; por lo menos en cuanto a los requisitos de produccion del conocimiento. no se produce conocimiento de calidad, y se excluyen tratamientos de tipo cualitarivos como orden de prioridad en materia de subsidios.
Comment 39:
 a nivel mundial, por la crisis del covid, a nivel local se suma la crisis socioeconomica
Comment 40:
 recursos limitados por la financiacion y una baja formacion en investigacion durante el grado.
Comment 41:
 si porque hay falta presupuesto y el sistema de investigacion esta sumamente fragmentado
Comment 42:
 falta de financiamiento, falta de derechos laborales para gran parte de lxs trabajadorxs de la ciencia (becarixs), dificultad de acceso a los papers (sin scihub es imposible investigar). la pandemia agravo casi todas las problematicas.
Comment 43:
 falta financiamiento. investigacion poco estrategica
Comment 44:
 en la ciencia argentina por la falta de financiacion y magros sueldos
Comment 45:
 despegada de las necesidades sociales
Comment 46:
 poca transparencia, falta de recursos en argentina.
Comment 47:
 poco presupuesto, que permite a menos gente ingresar al area, tambien generando mayor competencia entre los que nos dedicamos a la ciencia para poder seguir avanzando en la carrera pero generando un deficit en la calidad.
Comment 48:
 son muchas las causas, las primeras el presupuesto  y el direccionamiento 
Comment 49:
 pienso que la ciencia debe vivir situaciones de crisis constantemente; crisis es incomodidad, inestabilidad y por ende busqueda de novedades y soluciones
Comment 50:
 en verdad, la hubo y cada tanto regresa. frecuentemente, por la poca aplicabilidad y relevancia.


l = [text for text in belief_comments_df["belief_comments"] if "replica" in text]


for (i, text) in enumerate(l):
    print('Comment %d:\n'%(i+1), text)

Comment 1:
 por la falta de replicabilidad de los estudios.
Comment 2:
 hablando especificamente del campo de investigacion en psicologia social y politica existe una crisis que se debe a las bajas publicaciones de estudios de replicabilidad y los resultados desalentadores en los pocos estudios que existen.
a un nivel mas transversal la academia, debido a motivos politicos y economicos, posee diversos problemas que dificultan la creacion de una ciencia transparente, robusta, significativa y de una calidad superior (e.g preferencia de mayor volumen sacrificando calidad debido a politicas apoyando el publish or perish).
Comment 3:
 crisis en relacion a elementos criticables dentro de los sistemas de publicacion, ademas de aspectos metodologicos (como crisis de replicabilidad)
Comment 4:
 problemas en la operacionalizacion de variables y la validez ecologica que no permite buenos resultados en la replicabilidad
Comment 5:
 replicabilidad - teorias - metodos de analisis

Comment 6:
 particularmente en psicologia hay una clara crisis de replicabilidad. en cuanto a la ciencia en general hay problemas en la falta de acceso universal a trabajos cientificos, que tiene que ser suplido por herramientas como scihub (entre otros problemas).
Comment 7:
 crisis en cuano a replicabilidad (pocos experimentos replicados, incluso aquellos cuyos resultados son altamente importantes para el campo).


def make_table(column):
    """
    Returns: a table.
    """
    df = column.value_counts().to_frame().reset_index()
    df = df.T
    df.columns = df.iloc[0]
    df = df.drop(df.index[0])
    return df


def tables_by_columns(index_col_1, index_col_2):
    """
    Returns: a list containing different tables created from indexes.
    """
    l = []    
    for (i, column) in enumerate(df):
        if (i >= index_col_1 and i <= index_col_2):
            l.append(make_table(df[column]))
    return l


def combinate_tables(l):
    """
    Returns: a new dataframe.
    """
    df = pd.concat(l) 
    df.reset_index(level=0, inplace=True)
    df = df.rename(columns={'index': 'Measures'})
    return df


def convert_to_int(df):
    """
    Returns: a df with numerical values converted to int.
    """
    for (i, column) in enumerate(df):
        if (i > 0):
            df[[column]] = df[[column]].astype('Int64').fillna(0)
    return df


science = convert_to_int(combinate_tables(tables_by_columns(11, 27)))
experience = convert_to_int(combinate_tables(tables_by_columns(28, 38)))
efficiency = convert_to_int(combinate_tables(tables_by_columns(39, 49)))


science


science = science[["Measures", "Nada de acuerdo", "Algo de acuerdo", "No sé", "Bastante de acuerdo", "Muy de acuerdo"]]
experience = experience[["Measures", 
                         "Nunca lo hice, ni escuché hablar de eso", 
                         "Nunca lo hice, pero escuché hablar de eso", 
                         "Nunca lo hice, pero sé cómo hacerlo", 
                         "Lo intenté, pero no lo completé", 
                         "Sí, lo estoy haciendo", 
                         "Sí, lo he hecho"]]
efficiency = efficiency[["Measures", 
                         "Nada importante", 
                         "Poco importante", 
                         "No sé", 
                         "Medianamente importante", 
                         "Muy importante"]]


science


########


statistics = science.iloc[0:5]
fallacies = science.iloc[5:8]
replication = science.iloc[8:13]
novelty = science.iloc[13:15]
confidence = science.iloc[15:17]


########


experience


efficiency


science.to_csv(r'../data/cleaned/science.csv', index=False) 
########
statistics.to_csv(r'../data/cleaned/statistics.csv', index=False) 
fallacies.to_csv(r'../data/cleaned/fallacies.csv', index=False) 
replication.to_csv(r'../data/cleaned/replication.csv', index=False) 
novelty.to_csv(r'../data/cleaned/novelty.csv', index=False) 
confidence.to_csv(r'../data/cleaned/confidence.csv', index=False)
########
experience.to_csv(r'../data/cleaned/experience.csv', index=False)
efficiency.to_csv(r'../data/cleaned/efficiency.csv', index=False)


def science_by_methodology(serie):
    x,y = 'methodology', serie
    df1 = df.groupby(x)[y].value_counts(normalize=True)
    df1 = df1.mul(100)
    df1 = df1.rename('percent').reset_index()
    g = sns.catplot(x=x,
                    y='percent',
                    hue=y,
                    kind='bar',
                    data=df1,
                    height=5, 
                    aspect=2,
                    hue_order = ["Nada de acuerdo", "Algo de acuerdo", "No sé", "Bastante de acuerdo", "Muy de acuerdo"])
    g.ax.set_ylim(0,100)
    for ax in g.axes.ravel():
      for p in ax.patches:
        ax.annotate(format(p.get_height(), '.2f'), (p.get_x() + p.get_width() / 2.,
            p.get_height()), ha = 'center', va = 'center', xytext = (0, 10), 
            textcoords = 'offset points')
    g._legend.remove()
    plt.legend(loc='upper right')
    plt.title(serie + "\n" + "\n")


science_by_methodology("Cuando los resultados de diferentes investigadores son contradictorios entonces sería necesario llevar a cabo un estudio de replicación sobre la misma temática")


science_by_methodology("Cuando los resultados de diferentes investigadores son contradictorios entonces sería necesario llevar a cabo un estudio de replicación sobre la misma temática")


science_by_methodology("La realización de estudios de replicación es necesaria para el avance de la ciencia")


science_by_methodology("A las revistas científicas no les interesa publicar resultados que no son estadísticamente significativos")


science_by_methodology("Gran parte de los investigadores solamente publica los estudios en donde obtienen diferencias estadísticamente significativas")


science_by_methodology("El principal objetivo de las revistas científicas es publicar hallazgos novedosos")


science_by_methodology("Un resultado estadísticamente significativo es un resultado importante")


science_by_methodology("Una conclusión científica (por ejemplo, si un tratamiento es mejor que otro) debe estar basado en si el p-valor es o no es estadísticamente significativo")


science_by_methodology("Cuando leo un artículo tengo mayor confianza en la calidad del estudio si los resultados son estadísticamente significativos")


science_by_methodology("El valor de p = .001 confirma que el tamaño del efecto ha sido grande")


science_by_methodology("Las tareas de revisión y corrección de los manuscritos que llevan a cabo los revisores de las revistas garantizan de forma fiable la calidad de los resultados científicos")


science_by_methodology("El valor de p < .05 confirma que el hallazgo será útil para la comunidad científica")


science_by_methodology("La ciencia avanza más con estudios que plantean hipótesis novedosas que con estudios de replicación de otras investigaciones")


science_by_methodology("Si los resultados sobre una determinada temática son unánimes por parte de diferentes equipos de investigación entonces los estudios de replicación no son necesarios")


science_by_methodology("Creo que, en general, los errores que se pueden haber cometido en un estudio científico siempre se detectan y corrigen antes de ser publicados")


science_by_methodology("Los estudios de replicación solamente tienen sentido cuando no se detectan diferencias estadísticamente significativas en el estudio original")


science_by_methodology("No es necesario replicar un estudio cuando ya se detectaron efectos estadísticamente significativos en el estudio original")


science_by_methodology("Que un resultado no fuera estadísticamente significativo sería un criterio para no seguir investigando esas variables")


def science_by_education(serie):
    x,y = 'education', serie
    df1 = education_df.groupby(x)[y].value_counts(normalize=True)
    df1 = df1.mul(100)
    df1 = df1.rename('percent').reset_index()
    g = sns.catplot(x=x,
                    y='percent',
                    hue=y,
                    kind='bar',
                    data=df1,
                    #orient="h",
                    height=5, 
                    aspect=2,
                    hue_order = ["Nada de acuerdo", "Algo de acuerdo", "No sé", "Bastante de acuerdo", "Muy de acuerdo"])
    g.ax.set_ylim(0,100)
    for ax in g.axes.ravel():
      for p in ax.patches:
        ax.annotate(format(p.get_height(), '.2f'), (p.get_x() + p.get_width() / 2.,
            p.get_height()), ha = 'center', va = 'center', xytext = (0, 10), 
            textcoords = 'offset points')
    g._legend.remove()
    plt.legend(loc='upper right')
    plt.title(serie + "\n" + "\n")


science_by_education("Cuando los resultados de diferentes investigadores son contradictorios entonces sería necesario llevar a cabo un estudio de replicación sobre la misma temática")


science_by_education("Cuando los resultados de diferentes investigadores son contradictorios entonces sería necesario llevar a cabo un estudio de replicación sobre la misma temática")


science_by_education("La realización de estudios de replicación es necesaria para el avance de la ciencia")


science_by_education("A las revistas científicas no les interesa publicar resultados que no son estadísticamente significativos")


science_by_education("Gran parte de los investigadores solamente publica los estudios en donde obtienen diferencias estadísticamente significativas")


science_by_education("El principal objetivo de las revistas científicas es publicar hallazgos novedosos")


science_by_education("Un resultado estadísticamente significativo es un resultado importante")


science_by_education("Una conclusión científica (por ejemplo, si un tratamiento es mejor que otro) debe estar basado en si el p-valor es o no es estadísticamente significativo")


science_by_education("Cuando leo un artículo tengo mayor confianza en la calidad del estudio si los resultados son estadísticamente significativos")


science_by_education("El valor de p = .001 confirma que el tamaño del efecto ha sido grande")


science_by_education("Las tareas de revisión y corrección de los manuscritos que llevan a cabo los revisores de las revistas garantizan de forma fiable la calidad de los resultados científicos")


science_by_education("El valor de p < .05 confirma que el hallazgo será útil para la comunidad científica")


science_by_education("La ciencia avanza más con estudios que plantean hipótesis novedosas que con estudios de replicación de otras investigaciones")


science_by_education("Si los resultados sobre una determinada temática son unánimes por parte de diferentes equipos de investigación entonces los estudios de replicación no son necesarios")


science_by_education("Creo que, en general, los errores que se pueden haber cometido en un estudio científico siempre se detectan y corrigen antes de ser publicados")


science_by_education("Los estudios de replicación solamente tienen sentido cuando no se detectan diferencias estadísticamente significativas en el estudio original")


science_by_education("No es necesario replicar un estudio cuando ya se detectaron efectos estadísticamente significativos en el estudio original")


science_by_education("Que un resultado no fuera estadísticamente significativo sería un criterio para no seguir investigando esas variables")


def experience_by_methodology(serie):
    x,y = 'methodology', serie
    df1 = df.groupby(x)[y].value_counts(normalize=True)
    df1 = df1.mul(100)
    df1 = df1.rename('percent').reset_index()
    g = sns.catplot(x=x,
                    y='percent',
                    hue=y,
                    kind='bar',
                    data=df1,
                    height=5, 
                    aspect=2,
                    hue_order = ["Nunca lo hice, ni escuché hablar de eso", 
                                 "Nunca lo hice, pero escuché hablar de eso",
                                 "Nunca lo hice, pero sé cómo hacerlo",
                                 "Lo intenté, pero no lo completé",
                                 "Sí, lo estoy haciendo",
                                 "Sí, lo he hecho"])
    g.ax.set_ylim(0,100)
    for ax in g.axes.ravel():
      for p in ax.patches:
        ax.annotate(format(p.get_height(), '.2f'), (p.get_x() + p.get_width() / 2.,
            p.get_height()), ha = 'center', va = 'center', xytext = (0, 10), 
            textcoords = 'offset points')
    g._legend.remove()
    plt.legend(loc='upper right')
    plt.title(serie + "\n" + "\n")


experience_by_methodology('Replicar un estudio previo (1)')


experience_by_methodology('Pre-registrar un estudio antes de iniciar la recolección de datos (1)')


experience_by_methodology('Poner datos recolectados a disposición mediante plataformas o repositorios públicos (1)')


experience_by_methodology('Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos (1)')


experience_by_methodology('Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos (1)')


experience_by_methodology('Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio (1)')


experience_by_methodology('Compartir una pre-impresión (pre-print) publicándola en un repositorio público o semi-público (1)')


experience_by_methodology('Usar revisión por pares abierta (1)')


experience_by_methodology('Publicar en revistas de acceso abierto (1)')


experience_by_methodology('Adaptar un test psicométrico (1)')


experience_by_methodology('Participar en proyectos abiertos y colaborativos a gran escala (1)')


def experience_by_education(serie):
    x,y = 'education', serie
    df1 = education_df.groupby(x)[y].value_counts(normalize=True)
    df1 = df1.mul(100)
    df1 = df1.rename('percent').reset_index()
    g = sns.catplot(x=x,
                    y='percent',
                    hue=y,
                    kind='bar',
                    data=df1,
                    #orient="h",
                    height=5, 
                    aspect=2,
                    hue_order = ["Nunca lo hice, ni escuché hablar de eso", 
                                 "Nunca lo hice, pero escuché hablar de eso",
                                 "Nunca lo hice, pero sé cómo hacerlo",
                                 "Lo intenté, pero no lo completé",
                                 "Sí, lo estoy haciendo",
                                 "Sí, lo he hecho"])
    g.ax.set_ylim(0,100)
    for ax in g.axes.ravel():
      for p in ax.patches:
        ax.annotate(format(p.get_height(), '.2f'), (p.get_x() + p.get_width() / 2.,
            p.get_height()), ha = 'center', va = 'center', xytext = (0, 10), 
            textcoords = 'offset points')
    g._legend.remove()
    plt.legend(loc='upper right')
    plt.title(serie + "\n" + "\n")


experience_by_education('Replicar un estudio previo (1)')


experience_by_education('Pre-registrar un estudio antes de iniciar la recolección de datos (1)')


experience_by_education('Poner datos recolectados a disposición mediante plataformas o repositorios públicos (1)')


experience_by_education('Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos (1)')


experience_by_education('Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos (1)')


experience_by_education('Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio (1)')


experience_by_education('Compartir una pre-impresión (pre-print) publicándola en un repositorio público o semi-público (1)')


experience_by_education('Usar revisión por pares abierta (1)')


experience_by_education('Publicar en revistas de acceso abierto (1)')


experience_by_education('Adaptar un test psicométrico (1)')


experience_by_education('Participar en proyectos abiertos y colaborativos a gran escala (1)')


def efficiency_by_methodology(serie):
    x,y = 'methodology', serie
    df1 = df.groupby(x)[y].value_counts(normalize=True)
    df1 = df1.mul(100)
    df1 = df1.rename('percent').reset_index()
    g = sns.catplot(x=x,
                    y='percent',
                    hue=y,
                    kind='bar',
                    data=df1,
                    height=5, 
                    aspect=2,
                    hue_order = ["Nada importante", 
                                 "Poco importante",
                                 "No sé",
                                 "Medianamente importante",
                                 "Muy importante"])
    g.ax.set_ylim(0,100)
    for ax in g.axes.ravel():
      for p in ax.patches:
        ax.annotate(format(p.get_height(), '.2f'), (p.get_x() + p.get_width() / 2.,
            p.get_height()), ha = 'center', va = 'center', xytext = (0, 10), 
            textcoords = 'offset points')
    g._legend.remove()
    plt.legend(loc='upper right')
    plt.title(serie + "\n" + "\n")


efficiency_by_methodology('Replicar un estudio previo (2)')


efficiency_by_methodology('Pre-registrar un estudio antes de iniciar la recolección de datos (2)')


efficiency_by_methodology('Poner datos recolectados a disposición mediante plataformas o repositorios públicos (2)')


efficiency_by_methodology('Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos (2)')


efficiency_by_methodology('Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos (2)')


efficiency_by_methodology('Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio (2)')


efficiency_by_methodology('Compartir una pre-impresión (pre-print) publicándola en un repositorio de confianza (2)')


efficiency_by_methodology('Usar revisión por partes abierta (2)')


efficiency_by_methodology('Publicar en revistas de acceso abierto (2)')


efficiency_by_methodology('Adaptar un test psicométrico (2)')


efficiency_by_methodology('Participar en proyectos abiertos y colaborativos a gran escala (2)')


def efficiency_by_education(serie):
    x,y = 'education', serie
    df1 = education_df.groupby(x)[y].value_counts(normalize=True)
    df1 = df1.mul(100)
    df1 = df1.rename('percent').reset_index()
    g = sns.catplot(x=x,
                    y='percent',
                    hue=y,
                    kind='bar',
                    data=df1,
                    #orient="h",
                    height=5, 
                    aspect=2,
                    hue_order = ["Nada importante", 
                                 "Poco importante",
                                 "No sé",
                                 "Medianamente importante",
                                 "Muy importante"])
    g.ax.set_ylim(0,100)
    for ax in g.axes.ravel():
      for p in ax.patches:
        ax.annotate(format(p.get_height(), '.2f'), (p.get_x() + p.get_width() / 2.,
            p.get_height()), ha = 'center', va = 'center', xytext = (0, 10), 
            textcoords = 'offset points')
    g._legend.remove()
    plt.legend(loc='upper right')
    plt.title(serie + "\n" + "\n")


efficiency_by_education('Replicar un estudio previo (2)')


efficiency_by_education('Pre-registrar un estudio antes de iniciar la recolección de datos (2)')


efficiency_by_education('Poner datos recolectados a disposición mediante plataformas o repositorios públicos (2)')


efficiency_by_education('Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos (2)')


efficiency_by_education('Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos (2)')


efficiency_by_education('Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio (2)')


efficiency_by_education('Compartir una pre-impresión (pre-print) publicándola en un repositorio de confianza (2)')


efficiency_by_education('Usar revisión por partes abierta (2)')


efficiency_by_education('Publicar en revistas de acceso abierto (2)')


efficiency_by_education('Adaptar un test psicométrico (2)')


efficiency_by_education('Participar en proyectos abiertos y colaborativos a gran escala (2)')


barriers_1_by_methodology = df[["barriers_1", "methodology"]].assign(barriers_1=df[["barriers_1"]].barriers_1.str.split(";")).explode("barriers_1").reset_index(drop=True)


barriers_1_by_education = df[["barriers_1", "education"]].assign(education=df["education"].str.split(";")).explode("education").reset_index(drop=True)


barriers_1_by_education = barriers_1_by_education[["barriers_1", "education"]].assign(barriers_1=barriers_1_by_education[["barriers_1"]].barriers_1.str.split(";")).explode("barriers_1").reset_index(drop=True)


replace_columns(barriers_1_by_education, "education", "Licenciado", "Licenciatura")
replace_columns(barriers_1_by_education, "education", "Estudiante de licenciatura", "Licenciatura")
replace_columns(barriers_1_by_education, "education", "estudiante de doctorado", "Doctorado")
replace_columns(barriers_1_by_education, "education", "Doctorado en curso", "Doctorado")
replace_columns(barriers_1_by_education, "education", "Estudiante de Doctorado", "Doctorado")
replace_columns(barriers_1_by_education, "education", "En proceso de tesis de maestría", "Maestría")
replace_columns(barriers_1_by_education, "education", "Postdoctorado", "Doctorado")
replace_columns(barriers_1_by_education, "barriers_1", "[0-9.]", "")

<ipython-input-17-3aefb0f8314c>:6: FutureWarning: The default value of regex will change from True to False in a future version.
  df[col] = df[col].str.replace(original, replaced)


g = sns.catplot(y='barriers_1', 
            col='education', 
            data=barriers_1_by_education, 
            kind="count", 
            aspect=.8,
            order=barriers_1_by_education["barriers_1"].value_counts().index)
for ax in g.axes.ravel():
  for p in ax.patches:
    percentage = '{0:g}'.format(p.get_width()) 
    x = p.get_x() + p.get_width() + 0.02
    y = p.get_y() + p.get_height()/2
    ax.annotate(percentage, (x, y))


replace_columns(barriers_1_by_methodology, "barriers_1", "[0-9.]", "")

<ipython-input-17-3aefb0f8314c>:6: FutureWarning: The default value of regex will change from True to False in a future version.
  df[col] = df[col].str.replace(original, replaced)


g = sns.catplot(y='barriers_1', 
            col='methodology', 
            data=barriers_1_by_methodology, 
            kind="count", 
            order=barriers_1_by_methodology["barriers_1"].value_counts().index)
for ax in g.axes.ravel():
  for p in ax.patches:
    percentage = '{0:g}'.format(p.get_width()) 
    x = p.get_x() + p.get_width() + 0.02
    y = p.get_y() + p.get_height()/2
    ax.annotate(percentage, (x, y))


barriers_1_df = df[["barriers_1"]].assign(barriers_1=df[["barriers_1"]].barriers_1.str.split(";")).explode("barriers_1").reset_index(drop=True)


replace_columns(barriers_1_df, "barriers_1", "[0-9.]", "")

<ipython-input-17-3aefb0f8314c>:6: FutureWarning: The default value of regex will change from True to False in a future version.
  df[col] = df[col].str.replace(original, replaced)


horizontal_bar_plot(barriers_1_df["barriers_1"], "Major barriers against adopting open science practices")


def horizontal_bar_plot_with_percents(serie, title=None):
    y = serie.value_counts(ascending=True)
    fig, ax = plt.subplots(figsize=(20,15))
    ax.tick_params(labelsize=20)
    ax.barh(y.index, y, height=0.75, color="black")
    ax.set_title(title, fontsize=20)
    #ax.set_xlabel("Researchers", fontsize=20)
    #ax.set_ylabel("Frecuency", fontsize=20)
    _, xmax = plt.xlim()
    plt.xlim(0, xmax)
    plt.xticks([])
    for i, v in enumerate(y):
        #ax.text(v + .5, i, str('{}%'.format(round(v * 100 / 90), 2)), fontsize=20, ha='left', va='center')
        ax.text(v + .5, i, str(format(v * 100 / 90, '.2f')), fontsize=20, ha='left', va='center')
    plt.show()


horizontal_bar_plot_with_percents(barriers_1_df["barriers_1"])


### 7) Percentage of agreement with each, and combined, statements about attitudes against adopting open science practices. Analyse as a function of career stage and methodological approach


make_worldcloud(extract_text(df["barriers_2"]), ["de", "en", "la", "que", "y", "lo", "las", "para", "el", "no", 
                                                 "por", "a", "e", "los", "mi", "es", "se", "con", "cual", "veces", "muchas",
                                                "mayor", "un"])


barriers_2_df =df["barriers_2"].dropna().apply(unidecode).str.casefold().to_frame().reset_index(drop=True)


barriers_2_df["barriers_2"].count()

24


l = [text for text in barriers_2_df["barriers_2"]]


for (i, text) in enumerate(l):
    print('Comment %d:\n'%(i+1), text)

Comment 1:
 economia! muchas veces hay qeu pagar para que los demas tengan acceso
Comment 2:
 la mayor dificultad fue con las plataformas para depositar el material. la universidad donde trabajo por ejemplo no tiene repositorio institucional, asi que tuvimos que crear nuestra propia pagina (lo cual es un gasto extra). 
Comment 3:
 falta de entrenamiento y de tiempo para poder llevar a cabo el pre-registro
Comment 4:
 en mi equipo estamos constantemente aprendiendo temas nuevos y no tenemos tiempo de abocarnos a eso en este momento.
Comment 5:
 los recursos, y la falta de colaboracion institucional para poder desarrollar un proyecto.
Comment 6:
 para publicar en revistas de alto impacto piden dinero 
Comment 7:
 muchas veces la falta de regulacion conlleva a fomentar creencias negativas sobre la ciencia abierta, lo cual impide el trabajo colaborativo.
Comment 8:
 en la facultad el psa y su hegemonia, fuera de la facu ninguna por ahora
Comment 9:
 la mayor barrera directa que vivencio es que mi supervisor/director no conoce nada de esta movida y cree que no es importante. entonces me tengo que formar sola. 
Comment 10:
 falta de interes de los organismos financiadores o que aportan subsidios
Comment 11:
 no las he puesto en practica, salvo la divulgacion de mi produccion en plataformas libres.
Comment 12:
 falta de financiamiento e interes de las autoridades de la universidad.
Comment 13:
 falta de informacion y entrenamiento. 
Comment 14:
 principalmente, de financiamiento y tiempo.
Comment 15:
 falta de conocimiento en primer momento. luego falta de tiempo o que no era requisito.
Comment 16:
 no se promueve la investigacion, menos las practicas abiertas 
Comment 17:
 no experimente ninguna en particular, pero creo que tambien son practicas que se aprenden individual y grupalmente
Comment 18:
 recursos de acceso a bases de datos, bibliografia, software necesarios para implementacion de investigacion cuantitativa. no se facilitan los recursos para investigar desde las principales instituciones de investigacion del pais (uba, conicet).
Comment 19:
 las revistas de mayor impacto en mi campo no siempre son de acceso abierto
Comment 20:
 rechazo por partes de revistas 
Comment 21:
 las revistas pretenden en general resultados novedosos y significativos. las pocas veces q me han pedido replicar ha sido para aumentar los n estadisticos. cuesta mucho publicar una hipotesis que se rechaza, aunque el resultado sea claro y de interes. ademas, el sistema cientifico argentino se rige por cantidad de publicaciones mas que por calidad, con lo cual termina siendo contraproducente invertir tiempo en mejorar la calidad. algo que a mi juicio deberia cambiar.
Comment 22:
 falta de requirimiento, tiempo y apoyo
Comment 23:
 ninguna 
Comment 24:
 una de las principales barreras es el hecho de que las practicas de ciencia abierta inevitablemente suman pasos y requieren un nivel al menos basico de formacion para usar dichos recursos, sin que esto le sume "puntaje" a los investigadores. en la actualidad depende enteramente de la impronta de uno.
al ser practicas novedosas los directores de equipos muchas veces las desconocen y las abordan con desconfianza.
tambien falta interes en recursos y repositorios autoctonos (ejemplo: de la uba) que facilitaran la visibilizacion de los mismos, pocas personas buscan por su cuenta algo como la osf, por dar un ejemplo.


l = [text for text in df["comments"].dropna()]


for (i, text) in enumerate(l):
    print('Comment %d:\n'%(i+1), text)

Comment 1:
 El repositorio de CONICET se actualiza MUY lento! Y nuclea producción citable. Seria interesante que conicet tenga un espacio/repositorio para ciencia y datos abiertos. 
Comment 2:
 Ninguno, hagan público el resultado, y en lo posible algún curso abierto a los alumnos para interiorizarse en temas de ciencia abierta.
Comment 3:
 Éxitos en la tesina!
Comment 4:
 Me parece que la encuesta plantea una idea de ciencia muy específica con la cual muchxs de lxs investigadores no acordamos. Es parte de la disputa epistemológica. Por tanto algunos procesos que se interrogan parecen darse por obvios en todos los proyectos de investigación y no lo son. Adscribo a epistemologías de la complejidad y a marcos relacionales (no escisionistas) que abordan la investigación científica de modo muy diferente de cómo la concibe el positivismo. En este momento realizo una investigación que podría pensarse (desde ahí respondí) como "ciencia abierta" dado que es un proyecto colaborativo entre investigadores y docentes, pero nada tiene que ver con propuestas de "replicación" en sentido estricto. Por tanto no sé si las respuestas a esta encuesta son válidas para vos ya que las contesté teniendo otras perspectivas de las preguntas que las que usaste para construir el instrumento. Este problema para nosotrxs, por ejemplo, lejos de invalidar el instrumento,  es un gran hallazgo de una investigación. Suerte!!
Comment 5:
 Me parece genial que se realice investigación, acerca de la investigación. Aún, hay muchos mitos que esclarecer y trabajos que aportar. 
Saludos.
Comment 6:
 En una de las secciones existe una escala de 5 opciones de respuesta: "no se", "nada de acuerdo", "un poco de acuerdo", "bastante de acuerdo" y "completamente de acuerdo".

En varios de los items sentí que haber podido responder "algo en desacuerdo" hubiera sido más representativo de mis opiniones.

Comment 7:
 Los estudios en áreas donde trabajan muchos investigadores de distintos laboratorios, siempre se replican. Quizas no siguiendo el mismo exacto procedimiento, pero si con algunas variaciones. Si alguien falsea los datos o sesga un resultado (con o sin mala intención), mas tarde o mas temprano van a apsrecer resultados contradictorios. 
Comment 8:
 Suerte con la tesis
Comment 9:
 El ítem: "Que un resultado no fuera estadísticamente significativo sería un criterio para no seguir investigando esas variables" fue difícil de responder por contener una doble negación. Lo tuve que pensar bastante.
Comment 10:
 Definiría en algún lado qué entiende quien la elaboró por "ciencia abierta". 
Por otra parte, las razones por las que no son frecuentes dichas prácticas exceden las 20 expuestas. 
Comment 11:
 Es una encuesta demasiado centrada sobre la estadística, cuando incluso la investigación cuantitativa tiene una serie de procedimientos que no se limitan ni quedan registrados en los números y desvíos. El problema de la replicación es también teórico y de organización institucional. La evaluación interpares y el consenso crítico sobre los resultados tienen procesos propios muy poco atendidos. El problema de la replicación no se resuelve con más estadística, sino con otros modos de organizar la investigación y hacer circular la información de procedimientos metodológicos, financiamientos, muestras. En eso es mucho lo que se puede hacer desde la ciencia abierta, pero sería subutilizar ese recurso si lo que se va a compartir son gráficos y tablas. De lo que se trata es de compartir el diseño de las investigaciones, los recursos y la discusión conjunta de los datos obtenidos.
Comment 12:
 El cuestionario es interesante y su diseño es adecuado con relación a las variables que se examinan.
Como comentario, señalo dos apreciaciones a tener en cuenta:
1. Agregar en la descripción del consentimiento del estudio, alguna breve definición de ciencia y ciencia abierta para dar claridad a las dimensiones analíticas.
2. Cambiar el término persona, por investigadoras/es. Para quienes se inician en tareas de investigación o poseen becas de categoría "estímulo", el concepto de persona puede ser entendido de manera literal, haciendo perder la confiabilidad de este instrumento.
Comment 13:
 No. Solo decir que me encantó contestarla :)
Comment 14:
 Excelente todo! Excelente tema!
Comment 15:
 Me parece muy interesante y enriquecedor que se investigue sobre este aspecto, felicitaciones.
Comment 16:
 Muchas de las preguntas estan diseñadas mas especificamente para metodologias cuantitativas. 
Comment 17:
 No entiendo porque los valores de la variable están signados todos por el negativo. ¿Creen que nadie hace este tipo de práctica?
Comment 18:
 Interesante. Fue muy difícil completarlo desde el celular porque no se visualizaban bien las opciones de respuesta
Comment 19:
 muy interesante
Comment 20:
 no me halle muy representada en los items, es difícil responder cuando se trabaja con metodologías cualitativas
Comment 21:
 Aunque entiendo la lógica hay un problema conceptual en alg nas de las preguntas de replicación. Por ejemplo si tengo redultados "contradictorios" (de por si es un error considerarlos de este modo) otra replica no resolveria nada salvo que el n sea astronómico. Eso se resuelve al nivel del meta-analis, no de replicas, a lo sumo se requeriría de replicas de calidad alta para que este sea posible.
Un problema similar se da con la info "no contradictoria" la necesidad de replicas estaría más atada a la calidad y cantidad de la evidencia acumulada.

Pd: me encantó el tema!
Comment 22:
 Entiendo que está más dirigida a quienes trabajan con metodología cuantitativa, de hecho no me siento representada en cuanto a las cuestiones problemáticas que pudieran presentarse en mi trabajo


science["M"] = round(science.apply(lambda row: (row["Nada de acuerdo"] * 1) + 
                 (row["Algo de acuerdo"] * 2) +
                 (row["No sé"] * 3) +
                 (row["Bastante de acuerdo"] * 4 +
                 row["Muy de acuerdo"] * 5)
                 , axis=1) / 90, 2)
efficiency["M"] = round(efficiency.apply(lambda row: (row["Nada importante"] * 1) + 
                 (row["Poco importante"] * 2) +
                 (row["No sé"] * 3) +
                 (row["Medianamente importante"] * 4 +
                 row["Muy importante"] * 5)
                 , axis=1) / 90, 2)
experience["M"] = round(experience.apply(lambda row: (row["Nunca lo hice, ni escuché hablar de eso"] * 1) + 
                 (row["Nunca lo hice, pero escuché hablar de eso"] * 2) +
                 (row["Nunca lo hice, pero sé cómo hacerlo"] * 3) +
                 (row["Lo intenté, pero no lo completé"] * 4 +
                 row["Sí, lo estoy haciendo"] * 5 +
                 row["Sí, lo he hecho"] * 6)
                 , axis=1) / 90, 2)

science["SD"] = science.apply(lambda row: (row["Nada de acuerdo"] * 1) + 
                 (row["Algo de acuerdo"] * 4) +
                 (row["No sé"] * 9) +
                 (row["Bastante de acuerdo"] * 16 +
                 row["Muy de acuerdo"] * 25)
                 , axis=1) / 90
efficiency["SD"] = efficiency.apply(lambda row: (row["Nada importante"] * 1) + 
                 (row["Poco importante"] * 4) +
                 (row["No sé"] * 9) +
                 (row["Medianamente importante"] * 16 +
                 row["Muy importante"] * 25)
                 , axis=1) / 90
experience["SD"] = experience.apply(lambda row: (row["Nunca lo hice, ni escuché hablar de eso"] * 1) + 
                 (row["Nunca lo hice, pero escuché hablar de eso"] * 4) +
                 (row["Nunca lo hice, pero sé cómo hacerlo"] * 9) +
                 (row["Lo intenté, pero no lo completé"] * 16 +
                 row["Sí, lo estoy haciendo"] * 25 +
                 row["Sí, lo he hecho"] * 36)
                 , axis=1) / 90

science["SD"] = round(np.sqrt(science["SD"] - science["M"]), 2)
experience["SD"] = round(np.sqrt(experience["SD"] - experience["M"]), 2)
efficiency["SD"] = round(np.sqrt(efficiency["SD"] - efficiency["M"]), 2)

<ipython-input-163-d18d00e0bc9e>:1: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  science["M"] = round(science.apply(lambda row: (row["Nada de acuerdo"] * 1) +
<ipython-input-163-d18d00e0bc9e>:21: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  science["SD"] = science.apply(lambda row: (row["Nada de acuerdo"] * 1) +
<ipython-input-163-d18d00e0bc9e>:41: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  science["SD"] = round(np.sqrt(science["SD"] - science["M"]), 2)


science


experience


efficiency


science_cols = ["Nada de acuerdo", "Algo de acuerdo", "No sé", "Bastante de acuerdo", "Muy de acuerdo"]
experience_cols = ["Nunca lo hice, ni escuché hablar de eso", 
                         "Nunca lo hice, pero escuché hablar de eso", 
                         "Nunca lo hice, pero sé cómo hacerlo", 
                         "Lo intenté, pero no lo completé", 
                         "Sí, lo estoy haciendo", 
                         "Sí, lo he hecho"]
efficiency_cols = ["Nada importante", 
                         "Poco importante", 
                         "No sé", 
                         "Medianamente importante", 
                         "Muy importante"]

science[science_cols] = round(science[science_cols].div(science[science_cols].sum(axis=1), axis=0).multiply(100).astype("float"), 2)
experience[experience_cols] = round(experience[experience_cols].div(experience[experience_cols].sum(axis=1), axis=0).multiply(100).astype("float"), 2)
efficiency[efficiency_cols] = round(efficiency[efficiency_cols].div(efficiency[efficiency_cols].sum(axis=1), axis=0).multiply(100).astype("float"), 2)

C:\Users\Usuario\anaconda3\lib\site-packages\pandas\core\frame.py:3191: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self[k1] = value[k2]


science


experience


efficiency

index	Measures	Nada de acuerdo	Algo de acuerdo	No sé	Bastante de acuerdo	Muy de acuerdo	M	SD
0	Gran parte de los investigadores solamente publica los estudios en donde obtienen diferencias estadísticamente significativas	4.44	28.89	4.44	35.56	26.67	3.51	3.23
1	A las revistas científicas no les interesa publicar resultados que no son estadísticamente significativos	10.00	17.78	3.33	40.00	28.89	3.60	3.34
2	Cuando leo un artículo tengo mayor confianza en la calidad del estudio si los resultados son estadísticamente significativos	43.33	18.89	6.67	20.00	11.11	2.37	2.32
3	Que un resultado no fuera estadísticamente significativo sería un criterio para no seguir investigando esas variables	70.00	21.11	5.56	1.11	2.22	1.44	1.16
4	Una conclusión científica (por ejemplo, si un tratamiento es mejor que otro) debe estar basado en si el p-valor es o no es estadísticamente significativo	28.89	33.33	5.56	22.22	10.00	2.51	2.38
5	Un resultado estadísticamente significativo es un resultado importante	16.67	37.78	5.56	31.11	8.89	2.78	2.57
6	El valor de p < .05 confirma que el hallazgo será útil para la comunidad científica	33.33	37.78	13.33	11.11	4.44	2.16	1.94
7	El valor de p = .001 confirma que el tamaño del efecto ha sido grande	34.44	21.11	24.44	12.22	7.78	2.38	2.22
8	Cuando los resultados de diferentes investigadores son contradictorios entonces sería necesario llevar a cabo un estudio de replicación sobre la misma temática	4.44	23.33	1.11	33.33	37.78	3.77	3.48
9	La realización de estudios de replicación es necesaria para el avance de la ciencia	3.33	25.56	0.00	18.89	52.22	3.91	3.64
10	Si los resultados sobre una determinada temática son unánimes por parte de diferentes equipos de investigación entonces los estudios de replicación no son necesarios	43.33	38.89	4.44	11.11	2.22	1.90	1.68
11	Los estudios de replicación solamente tienen sentido cuando no se detectan diferencias estadísticamente significativas en el estudio original	63.33	17.78	16.67	2.22	0.00	1.58	1.27
12	No es necesario replicar un estudio cuando ya se detectaron efectos estadísticamente significativos en el estudio original	71.11	11.11	15.56	2.22	0.00	1.49	1.19
13	El principal objetivo de las revistas científicas es publicar hallazgos novedosos	23.33	28.89	1.11	30.00	16.67	2.88	2.75
14	La ciencia avanza más con estudios que plantean hipótesis novedosas que con estudios de replicación de otras investigaciones	44.44	32.22	3.33	12.22	7.78	2.07	1.97
15	Creo que, en general, los errores que se pueden haber cometido en un estudio científico siempre se detectan y corrigen antes de ser publicados	51.11	32.22	6.67	8.89	1.11	1.77	1.53
16	Las tareas de revisión y corrección de los manuscritos que llevan a cabo los revisores de las revistas garantizan de forma fiable la calidad de los resultados científicos	28.89	44.44	4.44	17.78	4.44	2.24	2.05

index	Measures	Nunca lo hice, ni escuché hablar de eso	Nunca lo hice, pero escuché hablar de eso	Nunca lo hice, pero sé cómo hacerlo	Lo intenté, pero no lo completé	Sí, lo estoy haciendo	Sí, lo he hecho	M	SD
0	Replicar un estudio previo (1)	2.22	23.33	32.22	2.22	12.22	27.78	3.82	3.67
1	Pre-registrar un estudio antes de iniciar la recolección de datos (1)	31.11	35.56	14.44	2.22	8.89	7.78	2.46	2.44
2	Poner datos recolectados a disposición mediante plataformas o repositorios públicos (1)	7.78	35.56	28.89	0.00	11.11	16.67	3.21	3.11
3	Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos (1)	8.89	41.11	23.33	3.33	10.00	13.33	3.04	2.94
4	Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos (1)	1.11	34.44	24.44	6.67	13.33	20.00	3.57	3.41
5	Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio (1)	0.00	16.67	12.22	4.44	22.22	44.44	4.66	4.40
6	Compartir una pre-impresión (pre-print) publicándola en un repositorio público o semi-público (1)	6.67	35.56	26.67	2.22	8.89	20.00	3.31	3.22
7	Usar revisión por pares abierta (1)	20.00	26.67	15.56	4.44	8.89	24.44	3.29	3.33
8	Publicar en revistas de acceso abierto (1)	0.00	7.78	13.33	3.33	18.89	56.67	5.03	4.70
9	Adaptar un test psicométrico (1)	7.78	35.56	18.89	2.22	11.11	24.44	3.47	3.42
10	Participar en proyectos abiertos y colaborativos a gran escala (1)	5.56	34.44	21.11	5.56	13.33	20.00	3.47	3.36

index	Measures	Nada importante	Poco importante	No sé	Medianamente importante	Muy importante	M	SD
0	Replicar un estudio previo (2)	0.00	2.22	4.44	51.11	42.22	4.33	3.86
1	Pre-registrar un estudio antes de iniciar la recolección de datos (2)	5.56	10.00	23.33	38.89	22.22	3.62	3.27
2	Poner datos recolectados a disposición mediante plataformas o repositorios públicos (2)	0.00	3.33	6.67	34.44	55.56	4.42	3.96
3	Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos (2)	1.11	6.67	7.78	26.67	57.78	4.33	3.92
4	Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos (2)	1.11	5.56	4.44	22.22	66.67	4.48	4.05
5	Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio (2)	0.00	3.33	4.44	14.44	77.78	4.67	4.20
6	Compartir una pre-impresión (pre-print) publicándola en un repositorio de confianza (2)	6.67	18.89	11.11	28.89	34.44	3.66	3.38
7	Usar revisión por partes abierta (2)	1.11	12.22	17.78	30.00	38.89	3.93	3.56
8	Publicar en revistas de acceso abierto (2)	1.11	4.44	4.44	17.78	72.22	4.56	4.11
9	Adaptar un test psicométrico (2)	3.33	12.22	7.78	22.22	54.44	4.12	3.78
10	Participar en proyectos abiertos y colaborativos a gran escala (2)	0.00	3.33	8.89	28.89	58.89	4.43	3.98

Exploratory analysis of Perceptions about Replicability Crisis and Open Science¶

Loading the necessary libraries¶

Loading the dataset¶

Analysis¶

1) Check for exclusion criteria in the demographic data, and in the completion rate¶

2) Describe the sample’s demographic characteristics¶

2.1) Education¶

2.2) Research area¶

2. 3) Position¶

2.4) Methodology¶

2.5) Age¶

3) Analyse the total percentage of “yes” responses to belief in crisis. Analyse as a function of career stage and methodological approach¶

3.1) Belief¶

3.2) Belief as a function of career stage¶

3.3) Belief as a function of methodological approach¶

3.4) Belief as a function of age¶

4) Qualitative analysis of open field response to belief in crisis¶

5) Percentage of agreement with each, and combined, statements about replication crisis, p-value, publication bias. Analyse as a function of career stage and methodological approach¶

6) Percentage of agreement with each, and combined, statements about perceived barriers. Analyse as a function of career stage and methodological approach¶

8) Qualitative analysis of open field response to attitudes about barriers against adopting open science practices¶

9) Other analysis¶

	Timestamp	¿Acepta participar?	Edad (años)	Nivel educativo alcanzado	Área/s de investigación	¿Ha participado en un proyecto de investigación (v. g., UBACyT, CONICET) en los últimos 5 años?	¿Ha publicado en una revista indexada con referato (v. g., Scopus, Scimago, Scielo) en los últimos 5 años?	Marque su posición actual en la Facultad de Psicología de la UBA	¿Qué tipo de metodología suele predominar en sus estudios?	¿Cree que hay una crisis en la ciencia?	Si su respuesta a la pregunta anterior ha sido “Sí”, señale por qué cree que hay una crisis en la ciencia	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Gran parte de los investigadores solamente publica los estudios en donde obtienen diferencias estadísticamente significativas]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [A las revistas científicas no les interesa publicar resultados que no son estadísticamente significativos]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Cuando leo un artículo tengo mayor confianza en la calidad del estudio si los resultados son estadísticamente significativos]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Que un resultado no fuera estadísticamente significativo sería un criterio para no seguir investigando esas variables]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Una conclusión científica (por ejemplo, si un tratamiento es mejor que otro) debe estar basado en si el p-valor es o no es estadísticamente significativo]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Un resultado estadísticamente significativo es un resultado importante]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [El valor de p < .05 confirma que el hallazgo será útil para la comunidad científica]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [El valor de p = .001 confirma que el tamaño del efecto ha sido grande]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Cuando los resultados de diferentes investigadores son contradictorios entonces sería necesario llevar a cabo un estudio de replicación sobre la misma temática]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [La realización de estudios de replicación es necesaria para el avance de la ciencia]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Si los resultados sobre una determinada temática son unánimes por parte de diferentes equipos de investigación entonces los estudios de replicación no son necesarios]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Los estudios de replicación solamente tienen sentido cuando no se detectan diferencias estadísticamente significativas en el estudio original]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [No es necesario replicar un estudio cuando ya se detectaron efectos estadísticamente significativos en el estudio original]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [El principal objetivo de las revistas científicas es publicar hallazgos novedosos]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [La ciencia avanza más con estudios que plantean hipótesis novedosas que con estudios de replicación de otras investigaciones]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Creo que, en general, los errores que se pueden haber cometido en un estudio científico siempre se detectan y corrigen antes de ser publicados]	Valore cada una de las siguientes cuestiones relacionadas con su opinión sobre la ciencia [Las tareas de revisión y corrección de los manuscritos que llevan a cabo los revisores de las revistas garantizan de forma fiable la calidad de los resultados científicos]	[Replicar un estudio previo]	[Pre-registrar un estudio antes de iniciar la recolección de datos]	[Poner datos recolectados a disposición mediante plataformas o repositorios públicos.]	[Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos]	[Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos]	[Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio]	[Compartir una pre-impresión (pre-print) publicándola en un repositorio público o semi-público]	[Usar revisión por pares abierta]	[Publicar en revistas de acceso abierto]	[Adaptar un test psicométrico]	[Participar en proyectos abiertos y colaborativos a gran escala]	[Replicar un estudio previo].1	[Pre-registrar un estudio antes de iniciar la recolección de datos].1	[Poner datos recolectados a disposición mediante plataformas o repositorios públicos]	[Compartir los métodos analíticos (e.g., scripts de análisis) en plataformas o repositorios públicos].1	[Poner los materiales (e.g., cuestionarios, procedimientos) a disposición mediante plataformas o repositorios públicos].1	[Reportar toda la información necesaria detalladamente para que otras personas puedan replicar mi estudio].1	[Compartir una pre-impresión (pre-print) publicándola en un repositorio de confianza]	[Usar revisión por partes abierta]	[Publicar en revistas de acceso abierto].1	[Adaptar un test psicométrico].1	[Participar en proyectos abiertos y colaborativos a gran escala].1	¿Cuáles le parecen que son las mayores barreras para la aceptación y puesta en práctica de prácticas de ciencia abierta en su campo y/o lugar de trabajo?	Si aplica, por favor describa brevemente qué barreras ha experimentado para incorporar o mantener prácticas de ciencia abierta	Por último, si posee alguna idea o comentario respecto a esta encuesta o al tema que aborda, por favor escribalo brevemente a continuación
0	2021/04/16 11:57:53 AM GMT-3	Sí	37	Licenciado	Psicoanálisis Filosofía	Sí	Sí	ATP	Cualitativa	No	NaN	Algo de acuerdo	Bastante de acuerdo	Bastante de acuerdo	Nada de acuerdo	Nada de acuerdo	Algo de acuerdo	Algo de acuerdo	Algo de acuerdo	Bastante de acuerdo	Bastante de acuerdo	Nada de acuerdo	No sé	Nada de acuerdo	Nada de acuerdo	Nada de acuerdo	Nada de acuerdo	No sé	Nunca lo hice, pero escuché hablar de eso	Nunca lo hice, pero escuché hablar de eso	Nunca lo hice, ni escuché hablar de eso	Nunca lo hice, pero escuché hablar de eso	Nunca lo hice, pero escuché hablar de eso	Nunca lo hice, pero escuché hablar de eso	Nunca lo hice, pero escuché hablar de eso	Nunca lo hice, pero escuché hablar de eso	Sí, lo he hecho	Nunca lo hice, pero escuché hablar de eso	Nunca lo hice, pero escuché hablar de eso	No sé	No sé	No sé	No sé	No sé	No sé	No sé	Poco importante	Medianamente importante	No sé	No sé	9. No percibo ninguna barrera	NaN	NaN
1	2021/04/16 12:13:54 PM GMT-3	Sí	48	Doctorado	Alcohol	Sí	Sí	Adjunto;Titular	MIxta	No	NaN	Muy de acuerdo	Muy de acuerdo	Nada de acuerdo	Nada de acuerdo	Algo de acuerdo	Bastante de acuerdo	Nada de acuerdo	Nada de acuerdo	Bastante de acuerdo	Bastante de acuerdo	Nada de acuerdo	Nada de acuerdo	Nada de acuerdo	Bastante de acuerdo	Nada de acuerdo	Nada de acuerdo	Algo de acuerdo	Sí, lo he hecho	Nunca lo hice, pero escuché hablar de eso	Nunca lo hice, pero escuché hablar de eso	Nunca lo hice, pero escuché hablar de eso	Nunca lo hice, pero escuché hablar de eso	Sí, lo he hecho	Sí, lo he hecho	Sí, lo he hecho	Sí, lo he hecho	Sí, lo he hecho	Sí, lo he hecho	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	1. Falta de incentivos;2. Falta de requerimiento por parte de financiadores, instituciones u otros organismos reguladores;3. Falta de información y entrenamiento;5. Falta de tiempo;10. El nivel de adopción de prácticas de ciencia abierta son suficientes en mi entorno (área, lugar de trabajo);18. Me parece desilusionante que si me tomo mucho trabajo no me valga para nada	NaN	NaN
2	2021/04/16 2:43:17 PM GMT-3	Sí	37	Doctorado	Neurociencia cognitiva	Sí	Sí	Titular	MIxta	No	NaN	Muy de acuerdo	Muy de acuerdo	Muy de acuerdo	Muy de acuerdo	Muy de acuerdo	Bastante de acuerdo	Bastante de acuerdo	Muy de acuerdo	Muy de acuerdo	Muy de acuerdo	Nada de acuerdo	Algo de acuerdo	Nada de acuerdo	Bastante de acuerdo	Muy de acuerdo	Bastante de acuerdo	Bastante de acuerdo	Sí, lo he hecho	Nunca lo hice, ni escuché hablar de eso	Sí, lo he hecho	Sí, lo he hecho	Sí, lo he hecho	Sí, lo he hecho	Sí, lo he hecho	Sí, lo he hecho	Sí, lo he hecho	Nunca lo hice, pero escuché hablar de eso	Sí, lo he hecho	Muy importante	No sé	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	1. Falta de incentivos;6. Falta de financiamiento específico	Economia! Muchas veces hay qeu pagar para que los demas tengan acceso	NaN
3	2021/04/16 3:33:59 PM GMT-3	Sí	31	Doctorado	Psicoterapia	Sí	Sí	Titular;Ademas cargo Investigacion/docente	Cuantitativa	Sí	Financiamiento	Bastante de acuerdo	Bastante de acuerdo	Algo de acuerdo	Nada de acuerdo	Bastante de acuerdo	Bastante de acuerdo	Algo de acuerdo	Muy de acuerdo	Muy de acuerdo	Muy de acuerdo	Bastante de acuerdo	Algo de acuerdo	Nada de acuerdo	Muy de acuerdo	Algo de acuerdo	Bastante de acuerdo	Muy de acuerdo	Nunca lo hice, pero sé cómo hacerlo	Nunca lo hice, pero escuché hablar de eso	Nunca lo hice, pero sé cómo hacerlo	Nunca lo hice, pero sé cómo hacerlo	Lo intenté, pero no lo completé	Sí, lo he hecho	Nunca lo hice, pero escuché hablar de eso	Sí, lo estoy haciendo	Sí, lo he hecho	Nunca lo hice, pero sé cómo hacerlo	Sí, lo he hecho	Medianamente importante	Poco importante	Muy importante	Muy importante	Muy importante	Muy importante	Poco importante	Muy importante	Medianamente importante	Muy importante	Medianamente importante	1. Falta de incentivos;3. Falta de información y entrenamiento;6. Falta de financiamiento específico;7. Falta de apoyo por investigadores avanzados (v. g., supervisores, directores del centro de investigación)	NaN	NaN
4	2021/04/16 3:35:35 PM GMT-3	Sí	38	Doctorado	Psicología del desarrollo	Sí	Sí	ATP	Cuantitativa	No	NaN	Algo de acuerdo	Bastante de acuerdo	Bastante de acuerdo	Nada de acuerdo	Nada de acuerdo	Nada de acuerdo	Nada de acuerdo	Nada de acuerdo	Bastante de acuerdo	Muy de acuerdo	Nada de acuerdo	Nada de acuerdo	Nada de acuerdo	Bastante de acuerdo	Bastante de acuerdo	Algo de acuerdo	Nada de acuerdo	Sí, lo he hecho	Nunca lo hice, pero sé cómo hacerlo	Sí, lo he hecho	Nunca lo hice, pero escuché hablar de eso	Sí, lo he hecho	Sí, lo he hecho	Sí, lo he hecho	Sí, lo he hecho	Sí, lo he hecho	Nunca lo hice, pero sé cómo hacerlo	Sí, lo he hecho	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	Muy importante	2. Falta de requerimiento por parte de financiadores, instituciones u otros organismos reguladores;3. Falta de información y entrenamiento;9. No percibo ninguna barrera	NaN	NaN