numpy.recfromcsv - как считывать строки+числа?

0

1

Есть скрипт:

#!/usr/bin/python3.2
import numpy

arr1 = numpy.recfromcsv(
  "test01.txt",
  dtype = [int, "|U8"],
  names = ["0", "1"],
  usecols = range(0-1)
)
print(arr1)
print(type(arr1[1][1]))

Он считывает файл:

1,"A B C"
2,'C D E'

И выдаёт такое:

[(1, b'"A B C"') (2, b"'C D E'")]
<class 'numpy.bytes_'>

Как бы сделать, чтобы модуль numpy грузил и хранил не numpy._bytes, а строки произвольной длины (str)?
В dtype есть только что-то вроде «|S5». То есть, строки фиксированной ширины.

Ссылка

← Почему именно так?

Учебник по HTML →

Никак, используй списки.

aedeph_ ★★
(18.12.12 03:23:12 MSK)

Ответ на: комментарий от aedeph_ 18.12.12 03:23:12 MSK

Что-то типа этого?

arr1_list = []
for row in arr1:
  row_new = []
  for item in row:
    if type(item) == numpy.bytes_:
      row_new.append(item.decode("utf-8"))
    else:
      row_new.append(item)
  arr1_list.append(row_new)
  print(row_new)
print(arr1_list)

pacify ★★★★★
(18.12.12 03:33:49 MSK) автор топика

Ответ на: комментарий от pacify 18.12.12 03:33:49 MSK

map(lambda x: (lambda y: (int(y[0]), y[1]))(x.replace("\n","").split(",")), open("test01.txt").readlines())

aedeph_ ★★
(18.12.12 03:45:27 MSK)

Ответ на: комментарий от aedeph_ 18.12.12 03:45:27 MSK

Ты забыл про обработку quotes в csv-файле. Это немного сложнее - там ещё экранирование символов надо учитывать.
Я вначале так и считывал, как список списков, разделяя строки сплитом.

pacify ★★★★★
(18.12.12 03:47:09 MSK) автор топика
Последнее исправление: pacify 18.12.12 03:47:38 MSK (всего исправлений: 1)

Ответ на: комментарий от pacify 18.12.12 03:47:09 MSK

Главное, что ты не забыл, это одно преобразование y[1].

Вообще, для этого модуль csv есть.

aedeph_ ★★
(18.12.12 03:47:57 MSK)
Последнее исправление: aedeph_ 18.12.12 03:49:09 MSK (всего исправлений: 1)

Ответ на: комментарий от aedeph_ 18.12.12 03:47:57 MSK

Вообще, для этого модуль csv есть.

Да, можно его заюзать. Я так раньше и делал.

Но данные мне нужно иметь в именованных столбцах numpy,
чтобы можно было сделать arr1.sort(order=str_col_name).

Чтобы не делать дополнительную перегонку из list(list) ->
numpy.ndarray, я и попытался грузить данные напрямую, через
np.recfromcsv().

pacify ★★★★★
(18.12.12 04:04:24 MSK) автор топика