Олег Марков
Работа с таблицами в Python с помощью DataFrame
Введение
В Python таблицы данных удобно обрабатывать с помощью структуры DataFrame из библиотеки pandas. Она позволяет хранить данные в табличном виде, выполнять фильтрацию, сортировку, группировку и анализ. DataFrame — основной инструмент анализа данных и обработки информации в Python. В этой статье мы разберём, как создавать, редактировать и анализировать таблицы с помощью DataFrame.
Создание DataFrame
Для начала установим и импортируем библиотеку pandas:
pip install pandasimport pandas as pd
data = {
'Имя': ['Анна', 'Иван', 'Петр'],
'Возраст': [25, 30, 22],
'Город': ['Москва', 'Казань', 'Самара']
}
df = pd.DataFrame(data)
print(df)Результат:
Имя Возраст Город
0 Анна 25 Москва
1 Иван 30 Казань
2 Петр 22 СамараDataFrame представляет собой таблицу, где каждая колонка имеет имя, а строки индексируются автоматически.
Работа с табличными данными тесно связана с основами Python: типами данных, циклами и функциями. Если вы хотите глубже разобраться в том, как Python работает с коллекциями и структурами данных, приходите на курс Основы Python. На курсе 209 уроков и 34 упражнения, AI-тренажёры для практики 24/7, ревью наставников и еженедельные встречи с менторами.
Чтение таблиц из файлов
DataFrame можно создать из CSV, Excel или других форматов:
# Чтение CSV
df = pd.read_csv('data.csv')
# Чтение Excel
df = pd.read_excel('data.xlsx')
# Просмотр первых строк
print(df.head())Доступ к данным
print(df['Имя']) # Получить столбец
print(df.loc[0]) # Получить строку по индексу
print(df.iloc[1:3]) # Получить диапазон строкМожно комбинировать фильтры и условия:
adults = df[df['Возраст'] > 24]
print(adults)Добавление и изменение данных
df['Страна'] = 'Россия'
df.loc[1, 'Возраст'] = 31
print(df)Удаление столбцов и строк:
df = df.drop('Город', axis=1) # удалить столбец
df = df.drop(0, axis=0) # удалить строкуАнализ таблиц
Pandas поддерживает множество методов анализа данных:
print(df.describe()) # Статистическая сводка
print(df['Возраст'].mean()) # Средний возраст
print(df.sort_values('Возраст', ascending=False))Сохранение таблицы
df.to_csv('output.csv', index=False)
df.to_excel('output.xlsx', index=False)Частые ошибки
- Ошибка
FileNotFoundErrorпри указании неверного пути к файлу. - Несовпадение кодировок при чтении CSV (решается
encoding='utf-8'). - Изменение данных без создания копии — используйте
df.copy()при необходимости.
Частозадаваемые вопросы
Как объединить две таблицы?
Используйте pd.concat([df1, df2]) или pd.merge(df1, df2, on='ключ').
Как изменить тип данных в столбце?
df['Возраст'] = df['Возраст'].astype(int).
Как удалить пропущенные значения?
df.dropna() — удалить, df.fillna(0) — заменить нулями.
Заключение
DataFrame — универсальный инструмент для работы с табличными данными в Python. Он упрощает анализ, фильтрацию и преобразование данных, делая обработку информации эффективной и читаемой.
Для системного изучения обработки данных и построения таблиц рекомендуем курс Основы Python, где вы сможете закрепить навыки на практике и научиться использовать pandas в реальных проектах.
Постройте личный план изучения Python до уровня Middle — бесплатно!
Python — часть карты развития Backend
100+ шагов развития
30 бесплатных лекций
300 бонусных рублей на счет
Все гайды по Python
Лучшие курсы по теме

Основы Python
Антон Ларичев
Nest.js с нуля
Антон Ларичев