Abstract: <p><em><strong>RUS</strong></em></p>
<p><strong>Последнее обновление: 23/05/2022</strong></p>
<p>Набор данных предназначен для разработки русскоязычных диалоговых систем (чат-ботов, вопросно-ответных систем и т. д.) о расстройствах аутистического спектра. Источник текстов: https://aspergers.ru</p>
<p>Проект реализуется победителем конкурса «Практики личной филантропии и альтруизма» Благотворительного фонда Владимира Потанина.</p>
<p><strong>Состав набора данных:</strong></p>
<p>1. original.json: оригинальная версия датасета</p>
<p>2. multiple.json: версия датасета с несколькими вариантами ответа</p>
<p>3. short.json: версия датасета с укороченными ответами</p>
<p>4. half_sized.json: версия датасета содержит 50% собранных данных</p>
<p>5. no_impossible.json: версия содержит только релевантные вопросы</p>
<p>6. impossible_question.tsv: список нерелевантных вопросов (используются для создания шумов в данных)</p>
<p>7. crowdsourcing.tsv: результаты краудсорсинга</p>
<p>8. age_dataset.tsv: набор данных для определения возраста пользователя (можно использовать для кастомизации моделей)</p>
<p>------</p>
<p><em><strong>ENG</strong></em></p>
<p>A dataset for question-answering used for building an informational Russian language chatbot for the inclusion of people with autism spectrum disorder and Asperger syndrome in particular, based on data from the following website: https://aspergers.ru.<br>
<strong>The dataset has several versions:<br>
</strong>1. Original version</p>
<p>2. Half-sized version (50% of the original data)</p>
<p>3. No impossible version (a version without irrelevant/impossible questions)</p>
<p>4. Short version (a version with shorterned answers)</p>
<p>5. Multiple version (a version with several answers, all the other versions contain only one answer to each question)</p>
External IDs:doi:10.6084/m9.figshare.13295831
Loading