Новая эра обработки данных: Партнёрство Voltron Data и Accenture для поддержки генеративного ИИ

С увеличением потребностей в обработке данных, связанных с развитием искусственного интеллекта, стартап Voltron Data из Маунтин-Вью предлагает решение одной из наиболее актуальных, хотя и недостаточно обсуждаемых проблем в этой области: быстрое перемещение и трансформация больших объемов данных, чтобы не отставать от новых вызовов.

Voltron Data, объявивший о стратегическом сотрудничестве с Accenture, разработал аналитическую платформу с использованием графических процессоров (GPU), что поможет компаниям преодолеть барьеры, мешающие эффективной подготовке данных для внедрения ИИ. Главный продукт компании Theseus ускоряет обработку данных до петабайтного масштаба, применяя GPU вместо традиционных центральных процессоров (CPU).

«Все внимание сосредоточено на впечатляющих новинках, которые можно видеть и трогать, но именно набор данных будет играть ключевую роль», — отметил Майкл Эбботт, возглавляющий банковскую практику в Accenture, в эксклюзивном интервью VentureBeat. «Для полноценной работы ИИ необходимо перемещать данные с невиданной ранее скоростью».

Это сотрудничество стало актуальным в период, когда компании, стремящиеся внедрять генеративный ИИ, замечают, что их текущая инфраструктура данных не способна обрабатывать требуемые объемы и скорость. По мере увеличения использования ИИ в бизнес-процессах эта проблема ожидается только в усугублении.

«Агенты, возможно, будут выполнять больше SQL-запросов, чем люди, в короткие временные рамки», — добавил Родриго Арамбуру, технический директор и соучредитель Voltron Data. «Если CIO и CTO уже заявляют о высоких затратах на аналитику и облачную инфраструктуру, а спрос только возрастает, необходимо снизить стоимость выполнения этих запросов».

В отличие от традиционных поставщиков баз данных, которые добавляли поддержку графических процессоров в уже существующие системы, Voltron Data создала свой движок с нуля, что позволяет достичь значительного ускорения обработки — от 10 до 100 раз, в зависимости от особенностей нагрузки.

«Большинство компаний интегрировали графические процессоры в свои системы, — пояснил Арамбуру в беседе с VentureBeat. — Разрабатывая платформу с нуля, мы достигаем более высокой производительности в зависимости от того, какие задачи выполняются».

Компания представляет Theseus как дополнение к таким популярным платформам, как Snowflake и Databricks, использующее фреймворк Apache Arrow для эффективной передачи данных.

«Это скорее ускоритель для существующих баз данных, а не конкурент», — добавил Эбботт. «Он продолжает работать с тем же SQL, обеспечивая значительно более быструю и параллельную обработку».

На начальном этапе акцент был сделан на отраслях, где требуется интенсивное использование данных, например, в финансовых услугах, с примерами использования, такими как обнаружение мошенничества, оценка рисков и соблюдение нормативных требований. По словам Арамбуру, один крупный ритейлер уменьшил число своих серверов с 1400 процессоров до 14 серверов с графическими процессорами после интеграции Theseus.

С момента представления на конференции Nvidia GTC в марте прошлого года, Voltron Data привлек около 14 корпоративных клиентов, включая два крупных государственных учреждения. Компания планирует выпустить «тестовую» версию, позволяющую потенциальным заказчикам тестировать графические запросы на данных терабайтного объёма.

Текущая нехватка графических процессоров, вызванная высоким спросом на ИИ, стала как вызовом, так и возможностью для Voltron Data. В то время как новые проекты сталкиваются с недостатком оборудования, многие компании располагают не полностью используемой GPU-инфраструктурой, ранее приобретенной для задач ИИ, и могут адаптировать её для обработки данных в период простоя.

«На самом деле, мы видим в этом преимущество, поскольку на рынке появилось много графических процессоров, которых ранее не было, — отметил Арамбуру, добавив, что Theseus может эффективно функционировать на графических процессорах предыдущего поколения, которые иначе могли бы стать ненужными.

Это решение может оказаться особенно полезным для банков, работающих с тем, что Эбботт называет «заблокированными данными» — информацией, хранящейся в таких форматах, как PDF и документах, полезных для обучения ИИ, но труднодоступным для обработки в больших объемах.

«В этой технологии вы можете увидеть данные, которые, согласно Voltron, можно перемещать на 90% эффективнее и экономичнее, чем с помощью традиционных процессоров», — сказал Эбботт. «Это и есть их сила».

По мере того как компании сталкиваются с возрастом данных, решения, способные ускорить обработку и сократить затраты на инфраструктуру, будут иметь всё большее значение. Партнёрство с Accenture может помочь Voltron Data расширить своё влияние среди организаций, сталкивающихся с этими вызовами, и предоставить клиентам Accenture доступ к технологиям, которые могут значительно повысить продуктивность их ИИ-инициатив.

Источник