Fint2000 | 7 Липня 2010, о 10:19 |
---|---|
Користувач |
Не хочеться втягуватися в дебати, але навіть несуттєва річ, така як інша літера в назві самого файлу, або в тегах і ви отримаєте по F4 не ерБќw9QД®ьї)Л=gн›T?Ї4Ш¦Oy@90ЁіђgЙфиZ—у7Ѕ»Їой«ШЃ а ерБќw9QД®ьї)Л=gн›T?Ї4Ш¦Oy@90ЁіђgЙфиZ—у7Ѕ»Їoй«ШЃ різницю побачили? |
Юрій Бульбах | 7 Липня 2010, о 10:32 |
Модератор |
Я ж не пропоную порівнювати весь вміст документа. Берем в різних місцях одного файла кусочки наприклад по 10 символів. І шукаємо входження цих кусочків в інших файлах. Якщо хоч один з кусочків повторюється - фтопку. Всього-навсього тра вирахувати якої кількості символів достатньо і скільки кусочків брати. |
Юрій Бульбах | 7 Липня 2010, о 10:34 |
Модератор |
о поміняти на о було дуже хитро, але я використовував не візуальне порівняння, а пошук, так що різницю помітив:-) |
Fint2000 | 7 Липня 2010, о 10:50 |
Користувач |
Я ж не пропоную порівнювати весь вміст документа. Берем в різних місцях одного файла кусочки наприклад по 10 символів. І шукаємо входження цих кусочків в інших файлах. Якщо хоч один з кусочків повторюється - фтопку. Всього-навсього тра вирахувати якої кількості символів достатньо і скільки кусочків брати. В яких місцях??? ви визначилися? І взагалі порівняння бінарних файлів провидиться по хешу MD5, але теоретично можливе співпадання хешу в різних файлах. Навіть якщо написати скрипт який буде відкидати ID3 теги(з початку (ID3v2) і в кінці (ID3v1)), і порівнювати сам поток mp3, то процес буде занадто довгим, а уявіть навантаження на сервер (завантажити в пам'ять навіть 2 файли розміром по 3 Мб) |
Юрій Бульбах | 7 Липня 2010, о 11:08 |
Модератор |
А про завантаження живої людини, яка має знайти і прослухати всі дублі, коли користувачі неправильно вказують назву і автора ви подумали? База мінусів повільно і впевнено перетворюється на помийну яму, в якій швидко знайти потрібне нереально. Навіть при такому автоматичному відсіюванні залишиться ще достатньо роботи для людини. Комп'ютери хіба не для того придумали, щоб допомагати людям? Про MD5 дискутувати не буду, в цих питаннях ви просунулись дальше ніж я:-) |
Fint2000 | 7 Липня 2010, о 11:32 |
Користувач |
Жива люди, якщо вона музикант і їй медвідь на вухо не наступив, може визначити якість по першим акордам, не потрібно оцінку якості покладати на машину. І ще я скажу, замість того щоб дискутувати, потрібно впорядкувати спочатку каталог по виконавцям, то наприклад є і Ротару Софія і Ротару і Софія Ротару і Ротару С. Модераторам спочатку потрібно зайнятися цим й прибрати дублі категорій, а потім вже вести розмову про дублі файлів. Повірте коли Ротару Софія буде одна, то й дублів менше буде |
Юрій Бульбах | 7 Липня 2010, о 11:50 |
Модератор |
Справа не в якості перших акордів, а всього мінуса. Перші акорди можуть бути якісні, а далі - задавка. Крім того, тра перевірити чи то бек чи не бек. Так що обмежити прослуховування першими акордами не получиться. Поки будуть впорядковуватись категорії засруться файли. А дублів менше не буде, бо навіть якщо всі категорії будуть впорядковані, хто заборонить користувачу ввести Софія Р. Так що, якщо процесору каву на контакти не налили, нехай би допомагав людям. |
Fint2000 | 7 Липня 2010, о 12:16 |
Користувач |
Про перші акорди я сказав як наприклад. Впрорядкокувати категорії можна паралельно і простіше зробити перевірку на наявність тієї чи іншої категорії(виконавця) ніж перевірку на вміст файлів |
Юрій Бульбах | 7 Липня 2010, о 12:26 |
Модератор |
Щодо паралельності згоден. Файли все-одно доведеться порівнювати, мінуси бувають з беком, з програшем, з якимись паузами, в різних тональностях, ремікси всякі. Відповідно доведеться якщо не слухати то принаймі промотувати щоб зрозуміти шо то залили. Потім брати вже залиті мінуси і прослуховувати на предмет ідентичності з залитим. А залитих може бути штук 15 - та ж Ротару, пісня Край. Навіть після чистки 5-7 мінусів цієї пісні мабуть залишиться. І кожного разу, коли черговий умнік залиє "Край" доведеться то всьо знов прослуховувати. |
Fint2000 | 7 Липня 2010, о 12:38 |
Користувач |
Я навіть більше скажу, мінус може бути просто суперовий, але коли він жметься з аудио в mp3 то деякы програми можуть різати або початок, або кінець. А щодо умніків, що заливають дублі, то в мене пропозиція при додаванні файлу, має відправлятися повідомлення модераторам про доданий файл, тоді можна буде оперативніше проводити чистки. Да і ще, на мою думку не повинно бути 10 варіантів пісні, бо є такі мінуса - писані на PSR-340 і які є на сайті, то не добре, я розумію що людина хоче поділитися своїми здобутками в написанні мінусів, але це можливо зробити використовуючи ресурс сайту частково, з використанням файлообмінників. Максимум має бути 3-4 варіанти пісні |
Будь-ласка авторизуйтесь для того щоб залишати повідомлення. Увійти