Гайд з цін на розмітку даних 2026: скільки коштує анотація?
Моделі ціноутворення: за зображення vs за годину vs за анотацію
Вендори розмітки даних використовують три основні моделі ціноутворення. У кожної є свої компроміси:
| Модель | Найкраще для | Ризик |
|---|---|---|
| За зображення | Послідовна складність (наприклад, всі вуличні сцени з подібною кількістю об'єктів) | Вендор може поспішити зі складними зображеннями, або ви переплатите за прості |
| За годину | Змінна складність, нові типи анотації, дослідницькі проєкти | Менш передбачувана загальна вартість — але ви платите лише за фактичну роботу |
| За анотацію | Прості задачі з відомою кількістю об'єктів (наприклад, рівно 5 bounding boxes на зображення) | Крайні випадки та складні зображення коштують стільки ж, скільки й прості |
Наша рекомендація: Почніть з погодинної оплати на першому проєкті. Це найпрозоріше — ви бачите, скільки часу займають задачі, і можете прогнозувати майбутні витрати. Переходьте на оплату за зображення, коли у вас будуть базові дані часу на зображення.
Реальні ціни за типом анотації
Ці діапазони базуються на реальних продакшн-проєктах з професійними командами анотаторів — не з краудсорсингових платформ, де якість сильно варіюється.
| Тип анотації | Діапазон цін | Що впливає на вартість |
|---|---|---|
| Bounding boxes | $0.02–0.10 за box | Кількість об'єктів на зображенні, перекриття, складність класифікації |
| Класифікація зображень | $0.01–0.05 за зображення | Кількість категорій, неоднозначність між класами |
| Polygon / instance segmentation | $0.20–1.50 за об'єкт | Складність форми об'єкта, кількість вершин, об'єкти, що перекриваються |
| Semantic segmentation (піксельний рівень) | $0.50–3.00 за зображення | Кількість класів, роздільна здатність зображення, необхідна точність |
| Відеоанотація (покадровий трекінг) | $0.03–0.15 за keyframe | Частота keyframes, кількість об'єктів для трекінгу, інтерполяція між keyframes зменшує вартість |
| Мультиатрибутна класифікація | $0.05–0.15 за об'єкт | Кількість атрибутів (вік, стать, одяг тощо) |
Що робить анотацію дорогою (або дешевою)
Фактори, що збільшують вартість
- Щільні сцени — 50+ об'єктів на зображення vs 5 об'єктів може означати 10x більше часу анотації
- Неоднозначні крайні випадки — "це вантажівка чи фургон?" потребує інструкцій, обговорень і іноді кількох раундів рев'ю
- Піксельна точність — semantic segmentation коштує в 5-10 разів більше, ніж bounding boxes на тому ж зображенні
- Кілька типів анотації — bounding box + класифікація + атрибути на одному зображенні множать роботу
- Малі партії — 100 зображень коштують більше за зображення, ніж 10 000, через overhead налаштування та розробки інструкцій
Фактори, що зменшують вартість
- Однотипні зображення — однаковий кут камери, ті самі об'єкти, той самий тип сцени = швидша анотація
- Якісні інструкції анотації — чіткі, візуальні інструкції з прикладами крайніх випадків зменшують переробку на 20-40%
- Pre-labeling — використання прогнозів моделі як відправної точки з подальшим людським рев'ю та виправленням
- Обсяг — більші партії амортизують витрати на налаштування і дозволяють анотаторам набрати швидкість через повторення
- Тривала співпраця — анотатори, які знають ваш домен, стають швидшими з часом без втрати якості
Не впевнені, який тип анотації вам потрібен? Прочитайте наш гайд Semantic vs Instance Segmentation — вибір правильного методу перед отриманням цінових пропозицій може заощадити 2-5x на бюджеті анотації.
Пілотна партія: як протестувати перед зобов'язанням
Ніколи не підписуйте великий контракт без пілотної партії. Ось стандартний підхід:
- Підготуйте 100-500 репрезентативних зображень — включіть найскладніші випадки, а не лише прості
- Напишіть інструкції анотації — або попросіть вашого вендора допомогти їх скласти
- Запустіть пілот — зазвичай займає 3-7 днів
- Перевірте якість — перевіряйте саме крайні випадки, а не випадкові зразки
- Виміряйте час на зображення — це дасть вам передбачуваність витрат для продакшн-партій
Червоний прапорець: Якщо вендор не робить пілотну партію або наполягає на великому мінімальному зобов'язанні до того, як ви побачили його роботу — йдіть. Будь-яка впевнена команда дозволить вам спочатку протестувати.
Хочете реальну оцінку для вашого проєкту? Надішліть нам зразок з 10-20 зображень та вимоги до анотації — ми надамо детальну цінову пропозицію протягом 24 годин. Забронюйте безкоштовну консультацію або напишіть нам напряму.
Приховані витрати, на які варто звернути увагу
- Раунди виправлень — деякі вендори беруть додаткову плату за виправлення. Інші включають 1-2 раунди в базову ціну. Запитуйте одразу.
- Розробка інструкцій — написання чітких інструкцій анотації потребує часу. Деякі вендори допомагають з цим, інші очікують ідеальних інструкцій з першого дня.
- Конвертація форматів — якщо ваш вендор доставляє у форматі CVAT, а ваш pipeline потребує COCO, хто конвертує? Це має бути включено.
- Управління проєктом — виділений PM vs тікетна система суттєво відрізняються у швидкості комунікації та зворотному зв'язку про якість.
- Переробка через якість — найнижча ціна за одиницю нічого не означає, якщо 30% анотацій потребують виправлення. Рахуйте вартість за придатну анотацію, а не вартість за анотацію.
Як скласти бюджет: швидка формула
Для планування:
- Оцініть загальну кількість зображень/кадрів
- Визначте тип анотації (bbox, polygon, segmentation)
- Оцініть об'єктів на зображення (середнє)
- Помножте: зображення × об'єкти × вартість за анотацію
- Додайте 20-30% буфер для виправлень, крайніх випадків та ітерацій інструкцій
Приклад: 5 000 зображень × 8 об'єктів/зображення × $0.05/bbox = $2 000 базова. З 25% буфером = ~$2 500 загальний бюджет. Це дає вашому CFO число з запасом на реальність.
Підсумок
Розмітка даних — не commodity. Найдешевший варіант майже ніколи не дає найкращу вартість за придатну мітку. Фокусуйтеся на:
- Отриманні пілотної партії перед зобов'язанням
- Вимірюванні часу на зображення для прогнозування продакшн-витрат
- Роботі з виділеною командою, яка вивчає ваш домен
- Розрахунку загальної вартості включно з переробкою, а не лише unit price