импорт данных и их аналитика

Задание закрыто
Стоимость:Договорная
Срок выполнения:10 дней
Варианты оплаты:По договоренности
Дата публикации:2024-12-30 18:28
Обновлено:2025-02-04 14:09
Был(а) на сайте:2025-02-04 15:12

импорт данных и их аналитика

 
Задача

импорт данных из эксель ( исходник), формирования таблиц большой массив 1000 файлов. Программист со знанием С++. Рассчитываю на длительное сотрудничество.

Оставлять заявки могут только авторизованные пользователи.
Здравствуйте, готов помочь, опыт есть.

Мои контакты:

ivan12.karpov9595@mail.ru

Телеграмм @mtap3019
Здравствуйте. Если ещё актуально, то пришлите 10 листов исходных данных. Надо посмотреть, с чем имеем дело. И ТЗ - что именно нужно из этих данных и в каком виде?
Алексей, задание понятно и выполнимое!

Но нужно понимать:
1) структура таблиц
2) объем данных в каждой таблице
3) разовая работа или постоянная
4) где хранятся данные
5) нужно ли редактировать данные при импорте таблиц

Пишите, обсудим и решим вашу задачу. Можно в Телеграм (контакт указан ниже)
Руслан Фазлиев
Основная специализация: Веб-разработка и Продуктовый дизайн
Здравствуйте, Алексей.
Готов реализовать импорт данных.
Буду рад сотрудничеству.
Здравствуйте! готов выполнить, обращайтесь
Здравствуйте! Куда нужно импортировать? Можно попробовать в mysql или sqlite. Как хотите видеть интерфейс после импорта?
Привет, имею большой опыт в разработке скриптов, сайтов, парсеров и просто програм на python, одним словом пишу всо, также пишу приложения на Андроид, с удовольствием возьмусь за работу, сделаю всо в лучшем виде и в кратчайшие сроки, также помогу запустить и разобраться.

Мое портфолио: https://ochistka35.wixsite.com/daichasportfolio
Мой телеграм: https://t.me/daichitakeda
Подробней можно? Если ексель то тут можно и средствами вба вероятно.
Александр Кургузов
Основная специализация: Веб-разработка и Продуктовый дизайн
    Здравствуйте, Алексей . Я недавно использую эту платформу, хотя в портфолио 9 работ. Обязуюсь тчательно выполнять задание за минимальную цену.

    Со мной можно связаться так :
    Почта: kurguzov47@yandex,ru
    Телеграмм: https://t.me/kurguzov47
    Телефон: +79052717645

    Сайт визитка https://alekurguzov.ru

    Примеры моих работ

    Телеграмм бот "RatingsPlayers"
    Приложение для андроид телефонов "Мои расходы"
    Телеграмм бот для обработки медицинских анализов
    2. Алгоритм и структура проекта
    Сбор данных

    Необходимо определить формат исходных Excel-файлов (колонки, листы, типы данных и т. д.).
    Учитывать, что 1000 файлов – это довольно большой объем, что может потребовать оптимизаций.
    Например, объединять их не «всё сразу», а пакетно (batched) или потоком (streaming).
    Импорт файлов

    Использовать pandas.read_excel для чтения каждого файла.
    Если у вас структурированные данные (одинаковые колонки) во всех 1000 файлах, можно писать некий цикл:
    import pandas as pd
    import glob

    all_files = glob.glob("path/to/files/*.xlsx") # например, все xlsx в папке
    df_list = []

    for file in all_files:
    data = pd.read_excel(file, sheet_name="Лист1") # или sheet_name по ситуации
    df_list.append(data)

    full_df = pd.concat(df_list, ignore_index=True)

    Если требуется читать не один лист, а сразу несколько, можно либо итерироваться по листам, либо использовать дополнительные параметры read_excel.
    Первичная очистка и обработка (Data Cleaning)

    Проверить наличие пропущенных значений (NaN), дубликатов, несоответствий типов данных (например, даты, строки, числа).
    Возможно, придётся написать небольшой «маппинг» (словарь) для наименований колонок, чтобы в итоговой таблице сохранить единообразие.

    Агрегация и трансформация данных

    Использовать методы groupby, pivot_table или merge/join (для объединения с дополнительными справочными таблицами).
    Если нужно собрать сводные таблицы и отчёты, то удобен pd.pivot_table.
    Аналитика

    На данном этапе (после формирования единого DataFrame) можно проводить аналитические операции:
    группировку по категориям (столбцам),
    расчёт статистик (средние, суммы, медианы и т. д.),
    построение временных рядов (если данные содержат даты),
    выделение ключевых метрик для отчётности.
    Сохранение результатов

    Результаты (промежуточные и финальные таблицы) обычно сохраняют в Excel, CSV или базу данных.
    В pandas это делается просто:
    full_df.to_excel("path/to/result.xlsx", index=False)
    Здравствуйте.
    Есть опыт работы с Excel.
    Хотелось бы обсудить детали

    Примеры моих работ

    Программа для системы Мой Город
    Построение решетчатого графа в трехмерном пространстве
    Сегментация изображения
    Здравствуйте, Алексей, готов обсудить детали проекта. Опыт есть!

    Жду Вашего ответа!
    Telegram - @ab_damirra
    WhatsApp- +79172088852
    Почта - freelancedamir@yandex.ru

    Примеры моих работ

    IT и Разработка
    Дизайн, Монтаж и 3D
    Копирайтинг, Рерайтинг и Переводы
    У меня основной python. Если важен С++, то я сделаю
    Здравствуйте, готов обсудить детали проекта, а также цену.
    Основной язык С++, фреймворк QT , есть опыт работы с EXCEl
    Контакты:
    Номер: +79631736236
    Ватс: +79631736236
    telegram: @Donaldtamerlan



    Оставлять заявки могут только авторизованные пользователи.