WeWin.RU

    • Зарегистрироваться
    • Войти
    • Поиск
    • Категории
    • Метки
    • Непрочитанные
    • Популярные
    • Пользователи
    • Группы

    Сегодня вчерашнее завтра

    Личные темы
    247
    4692
    664363
    Загружаем больше сообщений
    • Сначала старые
    • Сначала новые
    • По количеству голосов
    Ответить
    • Ответить, создав новую тему
    Авторизуйтесь, чтобы ответить
    Эта тема была удалена. Только пользователи с правом управления темами могут её видеть.
    • C
      casinomaister отредактировано casinomaister

      Тут экспертные умозаключения не помогут, основные держатели толкают рынок туда, куда им выгодно. Слушать кого-то себе дороже, тут сейчас карусель похлеще рулетки от Evolution gaming. Стригли, стригут, и будут стрич. Биткоин и большинство крипты, является сейчас машинкой для стрижки.

      1 ответ Последний ответ Ответить Цитировать 0
      • DimOK
        DimOK отредактировано DimOK

        Господа, помогите пожалуйста.

        Есть следующая задача: к нам приходит поток данных (цифры) в различные моменты времени, нужно в любой момент по запросу возвращать их сумму за последний час. Данных много, возвращать надо быстро.

        Я свою библиотечку три года назад сделал, сейчас захотел посмотреть, как люди реализуют подобное, но не могу понять, какой запрос описывает мою задачу? Если кто-то видел реализации подобного - поделитесь пожалуйста, задача-то достаточно популярная, много где такой функционал нужен.

        Upd: А, это вроде бы скользящая средняя, moving average то бишь.
        Upd2: Или нет... помогите, люди добрые!

        kvakirsanov 1 ответ Последний ответ Ответить Цитировать 0
        • kvakirsanov
          kvakirsanov @DimOK отредактировано

          Пользователь @DimOK написал в Сегодня вчерашнее завтра:

          Господа, помогите пожалуйста.

          Есть следующая задача: к нам приходит поток данных (цифры) в различные моменты времени, нужно в любой момент по запросу возвращать их сумму за последний час. Данных много, возвращать надо быстро.

          Я свою библиотечку три года назад сделал, сейчас захотел посмотреть, как люди реализуют подобное, но не могу понять, какой запрос описывает мою задачу? Если кто-то видел реализации подобного - поделитесь пожалуйста, задача-то достаточно популярная, много где такой функционал нужен.

          Upd: А, это вроде бы скользящая средняя, moving average то бишь.
          Upd2: Или нет... помогите, люди добрые!

          Похоже на задачу для sql сервера, delayed batch инсертов(если данных действительно много) и одного запроса на выборку

          1 ответ Последний ответ Ответить Цитировать 0
          • kvakirsanov
            kvakirsanov отредактировано

            И если данных ну прям совсем совсем много и прям совсем совсем быстро, то взять на сервер какой нибудь clickhouse

            1 ответ Последний ответ Ответить Цитировать 0
            • DimOK
              DimOK отредактировано

              Нет, что вы, нам не нужно сохранять данные, нам просто надо знать, сколько циферок пришло за последний час, их приходят сотни в секунду, всё что было раньше совсем не интересует.

              1 ответ Последний ответ Ответить Цитировать 0
              • Maharaja
                Maharaja Уважаемый отредактировано

                Нельзя один раз посчитать сумму и количество данных, а потом только прибавлять свежие данные и вычитать устаревшие, выпавшие из последнего часа?

                1 ответ Последний ответ Ответить Цитировать 0
                • DimOK
                  DimOK отредактировано

                  Можно конечно, но я хотел узнать, как называется эта задача, чтобы посмотреть как другие люди делали.
                  Свою реализацию я очень давно сделал и мне она даже нравится, там всякие хитрые манипуляции с массивами, чтобы лишних итераций не делать и всегда нужное значение знать

                  1 ответ Последний ответ Ответить Цитировать 0
                  • T
                    TverReus Уважаемый отредактировано

                    А в чем сложность задачи? Не посвящённому в разработку сходу не понять сложности

                    1 ответ Последний ответ Ответить Цитировать 0
                    • DimOK
                      DimOK отредактировано

                      Да ни в чем не сложность, хочу узнать, как она называется, чтобы посмотреть другие реализации :)

                      Rowdy 1 ответ Последний ответ Ответить Цитировать 0
                      • Rowdy
                        Rowdy @DimOK отредактировано Rowdy

                        @DimOK вообще это тема time series analysis из мат. статистики и time series database (TimescaleDB например, под крипто трейдинг активно используют).
                        Когда то использовал либу от фейсбука https://github.com/facebook/prophet тоже под крипто-анализ популярна очень.
                        Но в данном кейсе, как понимаю, вообще не нужен никакой анализ данных, только среднее.
                        И никакой базы данных не используется, так? Исходную же информацию надо знать как хранятся данные или одним запросом по апи дергаются, много вариантов, от чего зависит решение...

                        1 ответ Последний ответ Ответить Цитировать 1
                        • DimOK
                          DimOK отредактировано

                          Ну прикладная задача: мы наблюдаем за сделками по рынку, их нам присылают постоянно.

                          Нам интересно знать, в последние пять минут преимущественно продают или покупают?

                          При этом сделок у нас 10 штук в секунду на сотне рынков, а интересно знать нам бывает, допустим, каждую секунду. То есть складывать всё в базу и из базы выборку получать это не вариант, база закашляется любая либо на вставке (если индексы перестраивать), либо на чтении (если индексов нет).

                          Я решил так - берём необходимую точность, положим данные за пять минут нам нужны, нам подойдёт точность в три секунды. Получается 100 трёхсекундных отрезков. Записываем время начала слежения. Записываем куда была последняя запись. Записываем итоговую сумму. Новые данные присылаем с текущим временем, высчитываем в какой отрезок его записать, потом добавляем/отнимаем ячейки с момента последней записи так, чтобы у нас в итоговой сумме были актуальные данные без пересчёта всей суммы.

                          Всё, задача решена, добавление данных очень дешёвое, максимум цикл по 100 элементам, чтение бесплатное, так как значения обновляются при каждой записи за несколько арифметических операций по каждому элементу, а потом хранятся в готовом виде.

                          Rowdy 1 ответ Последний ответ Ответить Цитировать 0
                          • kvakirsanov
                            kvakirsanov отредактировано

                            ничего не будет с "базой", у вас достаточно небольшая нагрузка, справится и elk и заточенный под эти задачи кликхаус.

                            1 ответ Последний ответ Ответить Цитировать 0
                            • DimOK
                              DimOK отредактировано

                              Интересный подход... То есть предлагается хранить и делать запросы по выборкам на каждый чих, так как "железо позволяет"...

                              1 ответ Последний ответ Ответить Цитировать 0
                              • Rowdy
                                Rowdy @DimOK отредактировано

                                @DimOK это типичная задача для time series db, подобная выборка одним запросом делается.
                                Но вам, если не надо больше ничего делать с этими данными и как-то масштабироваться, то и такое костыльное решение нормально.
                                10 * 100 записей в секунду это ни о чем даже для postgresql + timescaledb, всего лишь до 100 млн записей в сутки.
                                Нагрузка на цп и диск минимальная, и с индексами всё хорошо будет, если конечно конфиг настроить, а не из коробки юзать.
                                Так что обычной SQL бд хватит. Big data начинается с миллионов записей в секунду, там уже спец. решения надо типа того же clickhouse.

                                1 ответ Последний ответ Ответить Цитировать 1
                                • DimOK
                                  DimOK отредактировано

                                  А мне вот жалко сервера мучать, я как представляю, сколько ненужных операций записи на эти несчастные SSD, как процессоры абстракции перемалывают - очень грустить начинаю :( В энтерпрайзе вообще с ума сошёл бы, наверное, от неэффективности.

                                  S 1 ответ Последний ответ Ответить Цитировать 0
                                  • DimOK
                                    DimOK отредактировано

                                    Это как я биржу ставок в 2005 году делал на файликах, тысячи файликов, потому что в базы данных не умел, а потом всё накрылось медным тазом из-за того, что каждый файлик 4 килобайта занимал на сервере, место кончилось... а тяга к велосипедам осталась :(

                                    Rowdy 1 ответ Последний ответ Ответить Цитировать 0
                                    • Rowdy
                                      Rowdy @DimOK отредактировано

                                      @DimOK о да, пхп скрипты на файлах, тоже в те года так говнокодил )) но потом как-то быстро лень стало парсить эти файлы каждый раз и править баги на этом этапе, и дошло зачем всё-таки нужен mysql ))

                                      1 ответ Последний ответ Ответить Цитировать 1
                                      • S
                                        SiP @DimOK отредактировано SiP

                                        Пользователь @DimOK написал в Сегодня вчерашнее завтра:

                                        сколько ненужных операций записи на эти несчастные SSD

                                        А поясните новичку пожалуйста, просто интересно, в энтерпрайзе в базы данных постоянно вносятся изменения, что-то записывается, что-то удаляется, по идеи жесткие диски должны часто выходить из строя (они же рассчитаны на определенное количество циклов перезаписи)? Или там специальные используются?

                                        Rowdy 1 ответ Последний ответ Ответить Цитировать 0
                                        • Rowdy
                                          Rowdy @SiP отредактировано Rowdy

                                          @SiP Есть enterprise ssd, с повышенной надежностью и ресурсом, но это не так важно когда RAID массив. Диск выходит из строя, его на горячую меняют.
                                          Но энтерпрайзу всё легче в облака пихать (Amazon AWS, Google Cloud например) и не заниматься такими проблемами.

                                          1 ответ Последний ответ Ответить Цитировать 3
                                          • Doubter
                                            Doubter отредактировано

                                            А что за памп был вчера по битку, даже какие-то суммы ощутимые пролетали и в битке и в эфире, не на новостях по Джонсону случаем? прям как-то совпало, или еще что-то, никто не знает?

                                            1 ответ Последний ответ Ответить Цитировать 0
                                            • R
                                              redya отредактировано

                                              @DimOK как считаете, ton будет ниже 50 руб или вряд ли?

                                              1 ответ Последний ответ Ответить Цитировать 0
                                              • DimOK
                                                DimOK отредактировано DimOK

                                                Хорошее казино

                                                Буквально после 200 спинов дало, на второй бонуске, хорошее казино.
                                                В этот раз по лимитам платят, 30 000 в сутки, миллион в месяц. Всем бы такие лимиты.

                                                dixeed M 2 ответов Последний ответ Ответить Цитировать 10
                                                • dixeed
                                                  dixeed Уважаемый @DimOK отредактировано

                                                  @DimOK денег нада? а, видимо уже нет :(

                                                  A 1 ответ Последний ответ Ответить Цитировать 0
                                                  • A
                                                    Andreich Уважаемый @dixeed отредактировано

                                                    Безымянный.jpg
                                                    По битку на бинансе вчера были огромные обьемы, а цена почти не сдвинулась. Кто разбирается, о чем это может говорить?

                                                    R dixeed 2 ответов Последний ответ Ответить Цитировать 0
                                                    • M
                                                      ma1phoy @DimOK отредактировано

                                                      @DimOK конечно платит, оно сейчас на твитче рекламится у тех, кто слотики крутит. :D

                                                      1 ответ Последний ответ Ответить Цитировать 0
                                                      • 1
                                                      • 2
                                                      • 152
                                                      • 153
                                                      • 154
                                                      • 155
                                                      • 156
                                                      • 187
                                                      • 188
                                                      • 154 / 188
                                                      • Первое сообщение
                                                        Последнее сообщение