импорт данных из эксель ( исходник), формирования таблиц большой массив 1000 файлов. Программист со знанием С++. Рассчитываю на длительное сотрудничество.
Оставлять заявки могут только авторизованные пользователи.
Здравствуйте. Если ещё актуально, то пришлите 10 листов исходных данных. Надо посмотреть, с чем имеем дело. И ТЗ - что именно нужно из этих данных и в каком виде?
Но нужно понимать: 1) структура таблиц
2) объем данных в каждой таблице
3) разовая работа или постоянная
4) где хранятся данные
5) нужно ли редактировать данные при импорте таблиц
Пишите, обсудим и решим вашу задачу. Можно в Телеграм (контакт указан ниже)
Привет, имею большой опыт в разработке скриптов, сайтов, парсеров и просто програм на python, одним словом пишу всо, также пишу приложения на Андроид, с удовольствием возьмусь за работу, сделаю всо в лучшем виде и в кратчайшие сроки, также помогу запустить и разобраться.
Необходимо определить формат исходных Excel-файлов (колонки, листы, типы данных и т. д.).
Учитывать, что 1000 файлов – это довольно большой объем, что может потребовать оптимизаций.
Например, объединять их не «всё сразу», а пакетно (batched) или потоком (streaming).
Импорт файлов
Использовать pandas.read_excel для чтения каждого файла.
Если у вас структурированные данные (одинаковые колонки) во всех 1000 файлах, можно писать некий цикл:
import pandas as pd
import glob
all_files = glob.glob("path/to/files/*.xlsx") # например, все xlsx в папке
df_list = []
for file in all_files:
data = pd.read_excel(file, sheet_name="Лист1") # или sheet_name по ситуации
df_list.append(data)
full_df = pd.concat(df_list, ignore_index=True)
Если требуется читать не один лист, а сразу несколько, можно либо итерироваться по листам, либо использовать дополнительные параметры read_excel.
Первичная очистка и обработка (Data Cleaning)
Проверить наличие пропущенных значений (NaN), дубликатов, несоответствий типов данных (например, даты, строки, числа).
Возможно, придётся написать небольшой «маппинг» (словарь) для наименований колонок, чтобы в итоговой таблице сохранить единообразие.
Агрегация и трансформация данных
Использовать методы groupby, pivot_table или merge/join (для объединения с дополнительными справочными таблицами).
Если нужно собрать сводные таблицы и отчёты, то удобен pd.pivot_table.
Аналитика
На данном этапе (после формирования единого DataFrame) можно проводить аналитические операции:
группировку по категориям (столбцам),
расчёт статистик (средние, суммы, медианы и т. д.),
построение временных рядов (если данные содержат даты),
выделение ключевых метрик для отчётности.
Сохранение результатов
Результаты (промежуточные и финальные таблицы) обычно сохраняют в Excel, CSV или базу данных.
В pandas это делается просто:
full_df.to_excel("path/to/result.xlsx", index=False)
Здравствуйте, готов обсудить детали проекта, а также цену.
Основной язык С++, фреймворк QT , есть опыт работы с EXCEl
Контакты:
Номер: +79631736236
Ватс: +79631736236
telegram: @Donaldtamerlan
Оставлять заявки могут только авторизованные пользователи.
импорт данных и их аналитика
Реклама
импорт данных и их аналитика
импорт данных из эксель ( исходник), формирования таблиц большой массив 1000 файлов. Программист со знанием С++. Рассчитываю на длительное сотрудничество.