Бесплатный Apache Parquet Viewer онлайн – открывайте и изучайте файлы Parquet

Просматривайте и анализируйте файлы Apache Parquet прямо в браузере. Изучайте схемы, метаданные и колоночные структуры данных для задач аналитики, Data Engineering и ETL-процессов, или конвертируйте Parquet в JSON, CSV, TSV или XLSX.

Upload Parquet File

Select a Parquet file to analyze and query. Maximum file size: 250MB

Drop your Parquet file here

or click to browse

Supported formats: .parquet, .parq
Max size: 250 MB

Ready to View Your Parquet Files?

Join thousands of developers who trust our OJF for their daily workflow. Fast, reliable, and completely free.

100% Free
No Registration
Privacy Protected

Онлайн Parquet Viewer для разработчиков и инженеров данных

Открывайте и инспектируйте файлы Apache Parquet онлайн через браузер. Анализируйте колоночные схемы, проверяйте метаданные, изучайте записи и экспортируйте выборки в JSON или CSV для отладки и валидации данных.

Как просмотреть файлы Parquet на Python

Просмотр файлов Parquet с помощью Pandas

python

Pandas самая популярная библиотека для манипуляции данными в Python, предоставляющая простую функцию read_parquet.

# Installation: pip install pandas
import pandas as pd

df = pd.read_parquet('path/to/file.parquet')
print(df.head())

Просмотр файлов Parquet с помощью DuckDB

python

DuckDB это встраиваемая SQL-СУБД для аналитической обработки (OLAP), которая позволяет выполнять запросы к Parquet-файлам напрямую.

# Installation: pip install duckdb
import duckdb

# Query directly from the file
result = duckdb.sql("SELECT * FROM 'path/to/file.parquet' LIMIT 10").fetchdf()
print(result)

Просмотр файлов Parquet с помощью ClickHouse

python

ClickHouse это быстрая аналитическая СУБД (OLAP) с открытым исходным кодом и нативной поддержкой формата Parquet.

# Installation: pip install clickhouse-connect
import clickhouse_connect

client = clickhouse_connect.get_client(host='localhost', port=8123)
query = "SELECT * FROM file('path/to/file.parquet') LIMIT 10"
result = client.query(query).result_set
print(result)

Как просмотреть файлы Parquet на других языках

Просмотр Parquet в Node.js

javascript

Использование библиотеки parquetjs для чтения файлов Parquet в среде JavaScript.

// Installation: npm install parquetjs
const parquet = require('parquetjs');

async function readParquet() {
    let reader = await parquet.ParquetReader.openFile('example.parquet');
    let cursor = reader.getCursor();
    let record = null;
    while (record = await cursor.next()) {
        console.log(record);
    }
    await reader.close();
}

Просмотр Parquet в Java

java

Использование Apache Parquet совместно с Avro для доступа к данным на уровне записей в Java.

// Required dependencies: parquet-avro, parquet-hadoop
import org.apache.hadoop.fs.Path;
import org.apache.parquet.hadoop.ParquetReader;
import org.apache.parquet.avro.AvroParquetReader;
import org.apache.avro.generic.GenericRecord;

Path path = new Path("example.parquet");
try (ParquetReader<GenericRecord> reader = AvroParquetReader.<GenericRecord>builder(path).build()) {
    GenericRecord record;
    while ((record = reader.read()) != null) {
        System.out.println(record);
    }
}

Key Features of OJF

Take control of your data - everything in one place

Инспекция схем и метаданных

  • Изучение иерархических схем Parquet, включая вложенные поля и логические типы данных
  • Проверка метаданных на уровне колонок: возможность иметь нулевые значения, кодировка и форматы сжатия
  • Анализ информации о группах строк (row groups) для понимания секционирования и структуры данных
  • Изучение статистики на уровне файла, используемой в аналитических нагрузках и Data Lakes

Исследование данных

  • Просмотр записей Parquet в структурированном табличном виде для удобного анализа
  • Применение фильтрации по колонкам с помощью встроенных инструментов или SQL-подобных выражений
  • Сортировка записей с учетом типов данных для точного упорядочивания
  • Преобразование временных меток (epoch) в читаемые форматы даты и времени
  • Статистический анализ данных в колонках, включая min, max и количество пустых (null) значений

Конвертация и экспорт

  • Конвертация файлов Parquet в формат JSON для работы с API и приложениями
  • Экспорт наборов данных в CSV или TSV для отчетности и анализа в таблицах
  • Загрузка данных в формате XLSX для совместимости с Microsoft Excel
  • Извлечение отфильтрованных подмножеств для валидации и последующей обработки
  • Скачивание наборов данных на основе заданных критериев фильтрации

Как просмотреть файлы Parquet онлайн

1

Загрузите файл Parquet (.parquet) с помощью кнопки выбора файла

2

Изучите схему, чтобы понять структуру колонок, типы данных и вложенность

3

Проверьте метаданные: тип сжатия, кодировку и группы строк

4

Просмотрите записи в табличном виде для валидации или отладки

5

Примените фильтры или поиск, чтобы сфокусироваться на нужных данных

6

Экспортируйте выбранные данные в JSON или CSV при необходимости

Why Choose Us?

Feature
Online JSON Formatt(OJF)
Other Tools
Видимость схемыИерархическая схема с контекстом метаданныхОграниченное или плоское отображение схемы
Обработка в браузереЛокальная обработка на стороне клиента (конфиденциально)Требуется загрузка файла на сервер
Гибкость экспортаЭкспорт в JSON, CSV и ExcelОграниченные варианты экспорта или их отсутствие

Frequently Asked Questions

Что такое файл Apache Parquet?
Apache Parquet это открытый формат колоночного хранения данных, разработанный для эффективной аналитики и обработки больших данных.Справочно: Документация Apache Parquet
Почему Parquet популярен в инженерии данных?
Parquet оптимизирован для аналитики благодаря поддержке сжатия, эффективного сканирования и обрезки колонок (column pruning), что делает его стандартом в экосистемах Big Data.Справочно: Databricks – Что такое Parquet?
Как открыть Parquet без Apache Spark или Hadoop?
Вы можете использовать онлайн Parquet Viewer для проверки схем, метаданных и записей прямо в браузере без необходимости настраивать Spark, Hadoop или другие тяжелые фреймворки.
Какие метаданные можно проверить в Parquet файле?
Метаданные Parquet включают определения схем, группы строк, статистику колонок, кодеки сжатия и типы кодирования, которые помогают понять производительность и объем хранения.Справочно: Apache Parquet Format – File Metadata
Можно ли конвертировать Parquet в другие форматы?
Да, данные Parquet часто конвертируют в JSON или CSV для обеспечения совместимости, подготовки отчетов и упрощения отладки.
Подходит ли Parquet для очень больших наборов данных?
Parquet специально разработан для масштабных аналитических наборов данных, обеспечивая компактное хранение и высокую производительность запросов в распределенных системах.