Autism Spectrum Disorder and Asperger Syndrome Question Answering Dataset 1.0

Published: 23 May 2022, Last Modified: 04 May 2026figshareEveryoneRevisionsCC BY-SA 4.0
Abstract: <p><em><strong>RUS</strong></em></p> <p><strong>Последнее обновление: 23/05/2022</strong></p> <p>Набор данных предназначен для разработки русскоязычных диалоговых систем (чат-ботов, вопросно-ответных систем и т. д.) о расстройствах аутистического спектра. Источник текстов: https://aspergers.ru</p> <p>Проект реализуется победителем конкурса «Практики личной филантропии и альтруизма» Благотворительного фонда Владимира Потанина.</p> <p><strong>Состав набора данных:</strong></p> <p>1. original.json: оригинальная версия датасета</p> <p>2. multiple.json: версия датасета с несколькими вариантами ответа</p> <p>3. short.json: версия датасета с укороченными ответами</p> <p>4. half_sized.json: версия датасета содержит 50% собранных данных</p> <p>5. no_impossible.json: версия содержит только релевантные вопросы</p> <p>6. impossible_question.tsv: список нерелевантных вопросов (используются для создания шумов в данных)</p> <p>7. crowdsourcing.tsv: результаты краудсорсинга</p> <p>8. age_dataset.tsv: набор данных для определения возраста пользователя (можно использовать для кастомизации моделей)</p> <p>------</p> <p><em><strong>ENG</strong></em></p> <p>A dataset for question-answering used for building an informational Russian language chatbot for the inclusion of people with autism spectrum disorder and Asperger syndrome in particular, based on data from the following website: https://aspergers.ru.<br> <strong>The dataset has several versions:<br> </strong>1. Original version</p> <p>2. Half-sized version (50% of the original data)</p> <p>3. No impossible version (a version without irrelevant/impossible questions)</p> <p>4. Short version (a version with shorterned answers)</p> <p>5. Multiple version (a version with several answers, all the other versions contain only one answer to each question)</p>
Loading