Бесплатный Apache Parquet Viewer онлайн – открывайте и изучайте файлы Parquet

Просматривайте и анализируйте файлы Apache Parquet прямо в браузере. Изучайте схемы, метаданные и колоночные структуры данных для задач аналитики, Data Engineering и ETL-процессов, или конвертируйте Parquet в JSON, CSV, TSV или XLSX.

Upload Parquet File

Select a Parquet file to analyze and query. Maximum file size: 100MB

Drop your Parquet file here

or click to browse

Supported formats: .parquet, .parq
Max size: 100 MB

4.5

Ready to View Your Parquet Files?

Join thousands of developers who trust our OJF for their daily workflow. Fast, reliable, and completely free.

100% Free
No Registration
Privacy Protected

Онлайн Parquet Viewer для разработчиков и инженеров данных

Открывайте и инспектируйте файлы Apache Parquet онлайн через браузер. Анализируйте колоночные схемы, проверяйте метаданные, изучайте записи и экспортируйте выборки в JSON или CSV для отладки и валидации данных.

Как просмотреть файлы Parquet на Python

Просмотр файлов Parquet с помощью Pandas

python

Pandas — самая популярная библиотека для манипуляции данными в Python, предоставляющая простую функцию read_parquet.

# Installation: pip install pandas
import pandas as pd

df = pd.read_parquet('path/to/file.parquet')
print(df.head())

Просмотр файлов Parquet с помощью DuckDB

python

DuckDB — это встраиваемая SQL-СУБД для аналитической обработки (OLAP), которая позволяет выполнять запросы к Parquet-файлам напрямую.

# Installation: pip install duckdb
import duckdb

# Query directly from the file
result = duckdb.sql("SELECT * FROM 'path/to/file.parquet' LIMIT 10").fetchdf()
print(result)

Просмотр файлов Parquet с помощью ClickHouse

python

ClickHouse — это быстрая аналитическая СУБД (OLAP) с открытым исходным кодом и нативной поддержкой формата Parquet.

# Installation: pip install clickhouse-connect
import clickhouse_connect

client = clickhouse_connect.get_client(host='localhost', port=8123)
query = "SELECT * FROM file('path/to/file.parquet') LIMIT 10"
result = client.query(query).result_set
print(result)

Как просмотреть файлы Parquet на других языках

Просмотр Parquet в Node.js

javascript

Использование библиотеки parquetjs для чтения файлов Parquet в среде JavaScript.

// Installation: npm install parquetjs
const parquet = require('parquetjs');

async function readParquet() {
    let reader = await parquet.ParquetReader.openFile('example.parquet');
    let cursor = reader.getCursor();
    let record = null;
    while (record = await cursor.next()) {
        console.log(record);
    }
    await reader.close();
}

Просмотр Parquet в Java

java

Использование Apache Parquet совместно с Avro для доступа к данным на уровне записей в Java.

// Required dependencies: parquet-avro, parquet-hadoop
import org.apache.hadoop.fs.Path;
import org.apache.parquet.hadoop.ParquetReader;
import org.apache.parquet.avro.AvroParquetReader;
import org.apache.avro.generic.GenericRecord;

Path path = new Path("example.parquet");
try (ParquetReader<GenericRecord> reader = AvroParquetReader.<GenericRecord>builder(path).build()) {
    GenericRecord record;
    while ((record = reader.read()) != null) {
        System.out.println(record);
    }
}

Key Features of OJF

Take control of your data - everything in one place

Инспекция схем и метаданных

  • Изучение иерархических схем Parquet, включая вложенные поля и логические типы данных
  • Проверка метаданных на уровне колонок: возможность иметь нулевые значения, кодировка и форматы сжатия
  • Анализ информации о группах строк (row groups) для понимания секционирования и структуры данных
  • Изучение статистики на уровне файла, используемой в аналитических нагрузках и Data Lakes

Исследование данных

  • Просмотр записей Parquet в структурированном табличном виде для удобного анализа
  • Применение фильтрации по колонкам с помощью встроенных инструментов или SQL-подобных выражений
  • Сортировка записей с учетом типов данных для точного упорядочивания
  • Преобразование временных меток (epoch) в читаемые форматы даты и времени
  • Статистический анализ данных в колонках, включая min, max и количество пустых (null) значений

Конвертация и экспорт

  • Конвертация файлов Parquet в формат JSON для работы с API и приложениями
  • Экспорт наборов данных в CSV или TSV для отчетности и анализа в таблицах
  • Загрузка данных в формате XLSX для совместимости с Microsoft Excel
  • Извлечение отфильтрованных подмножеств для валидации и последующей обработки
  • Скачивание наборов данных на основе заданных критериев фильтрации

Как просмотреть файлы Parquet онлайн

1

Загрузите файл Parquet (.parquet) с помощью кнопки выбора файла

2

Изучите схему, чтобы понять структуру колонок, типы данных и вложенность

3

Проверьте метаданные: тип сжатия, кодировку и группы строк

4

Просмотрите записи в табличном виде для валидации или отладки

5

Примените фильтры или поиск, чтобы сфокусироваться на нужных данных

6

Экспортируйте выбранные данные в JSON или CSV при необходимости

Why Choose Us?

Feature
Online JSON Formatt(OJF)
Other Tools
Видимость схемыИерархическая схема с контекстом метаданныхОграниченное или плоское отображение схемы
Обработка в браузереЛокальная обработка на стороне клиента (конфиденциально)Требуется загрузка файла на сервер
Гибкость экспортаЭкспорт в JSON, CSV и ExcelОграниченные варианты экспорта или их отсутствие

Frequently Asked Questions