Codenrock
В разработке
В разработке
УчастникНачальный10 мин

FILE: Загрузка файлов

Полное руководство по решению задач с загрузкой файлов и ML-соревнованиям

FILE: Загрузка файлов

FILE-задачи требуют загрузки файла с решением. Используются для презентаций, кода, документов и ML-соревнований с автоматической оценкой.

Интерфейс FILE-задачи

Страница FILE-задачи содержит:

ЭлементОписание
УсловиеЧто нужно сделать и загрузить
ТребованияФормат, размер, количество файлов
Зона загрузкиОбласть для перетаскивания или выбора файла
Прогресс загрузкиПолоса загрузки и процент
Статус файлаИмя, размер, состояние
Кнопка «Отправить»Для отправки решения
Счётчик попыток«Осталось попыток: X» (если ограничено)
ЛидербордРейтинг участников (для ML-задач)

Типы FILE-задач

Документы и презентации

Загрузка готового документа для ручной проверки.

Форматы: PDF, DOC, DOCX, PPT, PPTX, ODT

Применение:

  • Бизнес-план проекта
  • Презентация решения
  • Техническая документация
  • Отчёт о выполненной работе

Проверка: Ручная (организатор/жюри)

Результат: Через несколько часов или дней

Код и архивы

Загрузка исходного кода без автопроверки.

Форматы: ZIP, RAR, TAR.GZ, 7Z, PY, JS, и др.

Применение:

  • Код проекта на хакатоне
  • Архив с несколькими файлами
  • Конфигурационные файлы
  • Прототипы и MVP

Проверка: Ручная (code review)

Результат: После проверки организатором

ML-решения (автопроверка)

Загрузка предсказаний модели для автоматической оценки по метрике.

Формат: CSV

Применение:

  • ML-чемпионаты
  • Data Science соревнования
  • Kaggle-подобные задачи
  • Предсказательная аналитика

Проверка: Автоматическая

Результат: Мгновенно после загрузки

Ключевое отличие ML-задач: Результат виден сразу — система рассчитывает метрику качества (RMSE, Accuracy, F1, AUC-ROC и др.) и показывает ваш скор.

Изображения и медиа

Загрузка графических файлов.

Форматы: PNG, JPG, JPEG, GIF, SVG, WEBP

Применение:

  • Дизайн-макеты
  • Скриншоты решения
  • Диаграммы и схемы
  • Визуализации данных

Пошаговое прохождение

Шаг 1: Изучите требования

Перед подготовкой файла внимательно проверьте:

ПараметрЧто проверитьГде искать
ФорматКакие типы файлов принимаютсяВ условии: «PDF, PPTX»
РазмерМаксимальный размер файлаВ условии: «до 50 МБ»
КоличествоОдин файл или несколькоВ интерфейсе загрузки
СодержимоеЧто должно быть в файлеВ условии задачи
СтруктураДля CSV — колонки, форматВ sample_submission

Шаг 2: Подготовьте файл

Для документов и презентаций

  1. Следуйте шаблону — если организатор предоставил шаблон, используйте его
  2. Проверьте формат — сохраните в нужном формате (PDF, PPTX)
  3. Проверьте читаемость — откройте файл и убедитесь, что всё видно
  4. Проверьте размер — если превышает лимит, сожмите изображения

Для кода и архивов

  1. Соберите файлы — все необходимые файлы в одной папке
  2. Добавьте README — опишите как запустить код
  3. Укажите зависимости — requirements.txt, package.json
  4. Проверьте работоспособность — код должен запускаться
  5. Создайте архив — ZIP или TAR.GZ
  6. Исключите лишнее — не включайте node_modules, venv, .git

Для ML-решений

  1. Скачайте sample_submission — из условия задачи
  2. Изучите формат — колонки, типы данных, разделители
  3. Сгенерируйте предсказания — из вашей модели
  4. Проверьте локально — формат, количество строк, типы данных
  5. Сохраните как CSV — с правильными разделителями (запятая)

Шаг 3: Загрузите файл

Способ 1: Перетаскивание (Drag & Drop)

  1. Откройте папку с файлом
  2. Перетащите файл в зону загрузки на странице
  3. Отпустите, когда зона подсветится

Способ 2: Выбор через диалог

  1. Нажмите на зону загрузки или кнопку «Выбрать файл»
  2. В открывшемся окне найдите файл
  3. Нажмите «Открыть»

После загрузки вы увидите:

  • Имя файла
  • Размер файла
  • Прогресс загрузки (%)
  • Статус: «Загружен» или ошибку

Шаг 4: Отправьте решение

  1. Убедитесь, что файл загружен (статус «Загружен»)
  2. Нажмите «Отправить»
  3. Дождитесь результата:
    • Ручная проверка — статус «На проверке»
    • ML — скор появится через несколько секунд

ML-соревнования: подробно

Как работает автопроверка

1. Вы загружаете CSV с предсказаниями
2. Система валидирует файл (формат, колонки, строки)
3. Сравнивает ваши предсказания с правильными ответами (ground truth)
4. Рассчитывает метрику качества
5. Показывает ваш скор
6. Обновляет позицию в лидерборде

Формат CSV-файла

Стандартная структура:

id,prediction
1,0.75
2,0.23
3,0.91
4,0.44
5,0.18
КолонкаОписаниеПример
idИдентификатор объекта из test.csv1, 2, 3...
predictionВаше предсказание0.75, 1, "cat"

Важно: Скачайте sample_submission.csv из условия и следуйте его формату ТОЧНО — колонки, порядок, типы данных.

Метрики качества

В зависимости от типа задачи используются разные метрики:

Для регрессии (предсказание числа):

МетрикаОписаниеНаправление
RMSERoot Mean Square ErrorМеньше лучше
MAEMean Absolute ErrorМеньше лучше
Коэффициент детерминацииБольше лучше

Для классификации (предсказание класса):

МетрикаОписаниеНаправление
AccuracyДоля правильныхБольше лучше
F1F1-мераБольше лучше
AUC-ROCПлощадь под ROC-кривойБольше лучше
Log LossЛогарифмическая функция потерьМеньше лучше

Лидерборд

Публичный лидерборд — показывает скор на части тестовой выборки (обычно 30%). Виден всем во время соревнования.

Приватный лидерборд — скор на полной выборке. Открывается после окончания соревнования. Это финальный результат.

Почему так? Чтобы предотвратить переобучение на публичных тестах. Участники, которые «подгоняют» модель под публичный лидерборд, часто падают в приватном.

Типичный workflow ML-соревнования

1. Скачайте данные (train.csv, test.csv, sample_submission.csv)
2. Изучите данные и условие
3. Обучите базовую модель (baseline)
4. Сгенерируйте предсказания для test.csv
5. Загрузите submission и посмотрите скор
6. Улучшайте модель, повторяйте 4-5
7. Следите за лимитом попыток!

Попытки и лимиты

Ограничение попыток

ТипОписаниеСтратегия
1 попыткаФинальная загрузкаТщательно проверьте файл
N попытокМожно улучшатьИспользуйте с умом
Без ограниченийЗагружайте сколько нужноОбычно обучающие задачи

Лимит в день (для ML)

В ML-соревнованиях часто ограничено количество попыток в день:

Пример: 5 попыток в день

Зачем:

  • Предотвратить переобучение на тестовой выборке
  • Уравнять шансы участников
  • Стимулировать обдуманные решения

Советы:

  • Тестируйте локально перед загрузкой
  • Используйте кросс-валидацию
  • Не тратьте попытки на проверку формата

Учёт результата

РежимОписание
ЛучшийВ зачёт идёт лучший скор из всех попыток
ПоследнийВ зачёт идёт последняя загрузка
Выбор участникаВы сами выбираете финальный submission

Режим указан в условии задачи.


Статусы решения

Для ручной проверки

СтатусЗначениеЧто делать
ЗагружаетсяФайл передаётся на серверПодождите
📤 ЗагруженФайл на сервереНажмите «Отправить»
🔍 На проверкеОжидает проверкиЖдите результата
ПровереноОрганизатор выставил оценкуСмотрите баллы
ПринятоРешение засчитаноГотово!
ОтклоненоРешение не принятоЧитайте комментарий

Для ML с автопроверкой

СтатусЗначениеЧто делать
ЗагружаетсяФайл передаётсяПодождите
⚙️ ОбработкаСистема проверяетНесколько секунд
УспешноСкор рассчитанСмотрите результат
Ошибка форматаНеверная структураИсправьте файл
Ошибка валидацииПроблема с даннымиПроверьте содержимое

Частые ошибки в ML-задачах

Ошибки формата CSV

ОшибкаПричинаРешение
Неверный разделительИспользуется ; вместо ,Пересохраните с запятыми
Неверные колонкиНазвания не совпадаютСкопируйте из sample_submission
Пропущенные строкиНе все id есть в файлеДобавьте предсказания для всех
Лишние строкиБольше строк, чем в testУдалите лишние
Неверный тип данныхТекст вместо числаПроверьте тип prediction
Пустые значенияNaN, пустые ячейкиЗаполните все предсказания

Как избежать ошибок

import pandas as pd

# Загрузите sample
sample = pd.read_csv('sample_submission.csv')

# Проверьте формат
print(sample.head())
print(sample.dtypes)
print(len(sample))

# Создайте свой submission в том же формате
submission = sample.copy()
submission['prediction'] = your_predictions

# Проверьте перед сохранением
assert len(submission) == len(sample)
assert list(submission.columns) == list(sample.columns)

# Сохраните
submission.to_csv('my_submission.csv', index=False)

Проблемы и решения

Файл не загружается

ПроблемаРешение
«Неверный формат»Проверьте расширение файла
«Файл слишком большой»Сожмите или разделите
Загрузка завислаОбновите страницу, попробуйте снова
Кнопка неактивнаУбедитесь, что файл загружен

Ошибка формата (ML)

  1. Скачайте sample_submission.csv
  2. Откройте оба файла в текстовом редакторе
  3. Сравните:
    • Названия колонок (точное совпадение)
    • Разделитель (должна быть запятая)
    • Количество строк
    • Типы данных
  4. Исправьте и загрузите снова

Низкий скор (ML)

  1. Проверьте baseline — указан в условии, ваш скор должен быть лучше
  2. Проверьте формат — возможно, перепутан порядок строк
  3. Проверьте модель — нет ли переобучения?
  4. Попробуйте другой подход — другие признаки, алгоритмы
  5. Изучите форум — возможно, есть подсказки

Файл слишком большой

Тип файлаКак уменьшить
ДокументыСожмите изображения внутри
ПрезентацииУменьшите качество картинок
АрхивыУдалите лишние файлы
ИзображенияУменьшите разрешение

Советы для успеха

Для документов и презентаций

СоветПочему важно
Используйте шаблонСоответствие требованиям
Проверьте открываемостьФайл должен открываться
Называйте понятноTeam_Alpha_Final.pdf, не v3_new_final.pdf
Сохраните копиюНа случай проблем
Соблюдайте объём10-15 слайдов, если указано

Для кода

СоветПочему важно
Добавьте READMEОбъясните как запустить
Укажите зависимостиrequirements.txt обязателен
Проверьте запускКод должен работать
Уберите секретыНикаких паролей и ключей
Исключите мусорБез node_modules, pycache

Для ML

СоветПочему важно
Изучите sampleТочный формат критичен
Тестируйте локальноНе тратьте попытки на ошибки формата
Используйте CVКросс-валидация показывает реальное качество
Экономьте попытки5 в день — это мало
Не переобучайтесьПубличный ≠ приватный лидерборд
Читайте условиеТам часто есть подсказки

Частые вопросы

В: Можно заменить загруженный файл?

О: Да, если есть ещё попытки. Загрузите новый файл — он заменит предыдущий.

В: Какой максимальный размер файла?

О: Обычно 10-50 МБ. Точный лимит указан в условии задачи.

В: Когда будет результат ручной проверки?

О: Зависит от конкурса — от нескольких часов до нескольких дней. Организатор проверяет каждый файл вручную.

В: Почему мой скор в ML-соревновании низкий?

О: Возможные причины:

  1. Ошибка в формате файла
  2. Модель недообучена или переобучена
  3. Неправильный подход к задаче

Сравните с baseline в условии.

В: Что такое публичный и приватный лидерборд?

О: Публичный — скор на части тестов (видимый). Приватный — на всех тестах (открывается в конце). Финальный результат по приватному.

В: Почему скор на публичном и приватном разный?

О: Это нормально. Если сильно хуже — возможно, вы переобучились на публичный лидерборд.

В: Можно загрузить несколько файлов?

О: Если разрешено настройками — да. Иначе соберите всё в один архив ZIP.

В: Что будет, если закончатся попытки?

О: Больше загружать нельзя. В зачёт пойдёт лучший (или последний) результат в зависимости от настроек.


Связанные статьи

Последнее обновление: 07.02.2026
К оглавлению